什么是字符编码像ansi和unicode,他们有什么不同?

ASCII、UTF-8、ISO-8859……你可能已经看到这些奇怪的名字四处飘浮,但它们到底是什么意思?请继续阅读,我们将解释什么是字符编码,以及这些缩写词如何与屏幕上显示的纯文本相关。...

什么是字符编码像ansi和unicode,他们有什么不同?

ASCII、UTF-8、ISO-8859……你可能已经看到这些奇怪的名字四处飘浮,但它们到底是什么意思?请继续阅读,我们将解释什么是字符编码,以及这些缩写词如何与屏幕上显示的纯文本相关。

基本构建块

当我们谈到书面语言时,我们会说字母是单词的组成部分,然后字母就构成了句子、段落等等。字母是代表声音的符号。当你谈论语言时,你谈论的是一组声音,它们组合在一起形成某种意义。每个语言系统都有一套复杂的规则和定义来管理这些意义。如果你有一个词,除非你知道它来自哪种语言,并且你和说这种语言的人一起使用它,否则它是无用的。

什么是字符编码像ansi和unicode,他们有什么不同?

(比较Grantha、Tulu和Malayalam脚本,图片来自维基百科)

在计算机世界中,我们使用“字符”这个术语。字符是一种抽象概念,由特定参数定义,但它是意义的基本单位。拉丁字母“A”与希腊字母“alpha”或阿拉伯语字母“alif”不同,因为它们有不同的上下文-它们来自不同的语言,发音略有不同-所以我们可以说它们是不同的字符。字符的视觉表示称为“字形”,不同的字形集称为字体。一组字符属于“集合”或“剧目”

当你输入一个段落并改变字体时,你不是在改变字母的音标值,而是在改变它们的外观。这只是表面的(但不是不重要的!)。有些语言,如古埃及语和汉语,有表意文字;这些文字代表的是整个思想而不是声音,它们的发音可以随着时间和距离的变化而变化。如果你用一个字符替换另一个字符,你就是在替换一个想法。它不仅仅是改变字母,它改变了一个表意文字。

字符编码

什么是字符编码像ansi和unicode,他们有什么不同?

(图片来自维基百科)

当你在键盘上输入一些东西,或者载入一个文件时,计算机如何知道要显示什么?这就是字符编码的目的。计算机上的文本实际上不是字母,而是一系列成对的字母数字值。字符编码充当一个键,使哪些值对应于哪些字符,就像正字法指示哪些声音对应于哪些字母一样。莫尔斯电码是一种字符编码。它解释了长单位和短单位(如嘟嘟声)如何表示字符。在莫尔斯电码中,字符只是英文字母、数字和句号。有许多计算机字符编码可以翻译成字母、数字、重音符号、标点符号、国际符号等。

在这个主题中,通常还使用术语“代码页”。它们本质上是特定公司使用的字符编码,通常稍加修改。例如,windows1252代码页(以前称为ansi1252)是ISO-8859-1的一种修改形式。它们主要用作一个内部系统,用来表示特定于同一系统的标准和修改的字符编码。在早期,字符编码并不那么重要,因为计算机之间没有通信。随着互联网的崛起和网络化成为一种普遍现象,它已经成为我们日常生活中越来越重要,我们甚至没有意识到它。

许多不同的类型

什么是字符编码像ansi和unicode,他们有什么不同?

(图片来自莎拉索西亚克)

有很多不同的字符编码,有很多原因。您选择使用哪种字符编码取决于您的需要。如果你用俄语交流,使用支持西里尔文的字符编码是有意义的。如果你用韩语交流,那么你会想要一些能很好地代表朝鲜文和朝鲜文的东西。如果你是一个数学家,那么你想要一个能很好地表达所有科学和数学符号,以及希腊和拉丁符号的东西。如果你是一个恶作剧者,也许你会受益于倒置的文字。而且,如果您希望任何给定的人都能查看所有这些类型的文档,那么您需要一种非常常见且易于访问的编码。

我们来看看一些比较常见的。

什么是字符编码像ansi和unicode,他们有什么不同?

(ASCII表格摘录,图片来自asciitable.com网站)

  • 美国信息交换标准码(ASCII)是较早的字符编码之一。它最初是基于电报编码设计的,随着时间的推移逐渐演变为包含更多的符号和一些现已过时的非印刷控制字符。在现代系统中,它可能是最基本的,因为它仅限于没有重音字符的拉丁字母表。它的7位编码只允许128个字符,这就是为什么世界各地都在使用一些非官方的变体。
  • ISO-8859–国际标准化组织最广泛使用的字符编码组是编号8859。每个特定的编码都由一个数字指定,通常以一个描述性名字作为前缀,例如ISO-8859-3(拉丁语-3)、ISO-8859-6(拉丁语/阿拉伯语)。它是ASCII的超集,意味着编码中的前128个值与ASCII相同。然而,它是8位的,允许256个字符,因此它是在那里构建的,包括更广泛的字符数组,每个特定的编码集中在一组不同的标准上。拉丁-1包括了一堆重音字母和符号,但后来被一套名为拉丁-9的修订集所取代,其中包括像欧元符号这样的更新字形。

什么是字符编码像ansi和unicode,他们有什么不同?

(藏文Unicode v4节选自unicode.org)

  • Unicode–此编码标准旨在实现通用性。它目前包括93个脚本组织在几个街区,与更多的工作。Unicode的工作原理与其他字符集不同,它不是直接为字形编码,而是将每个值进一步定向到一个“码点”。这些是对应于字符的十六进制值,但字形本身是由程序以分离的方式提供的,这些代码点通常描述如下:U+0040(翻译成“@”)。Unicode标准下的特定编码是UTF-8和UTF-16。UTF-8试图最大限度地兼容ASCII。它是8位的,但是通过替换机制允许所有字符,每个字符有多对值。UTF-16抛弃了完美的ASCII兼容性,实现了与标准的更完整的16位兼容性。
  • ISO-10646–这不是一个实际的编码,只是一个由ISO标准化的Unicode字符集。它非常重要,因为它是HTML使用的字符库。Unicode提供的一些更高级的函数,允许排序和从右到左以及从左到右的脚本编写,但是缺少了这些函数。尽管如此,它仍然非常适合在互联网上使用,因为它允许使用各种各样的脚本,并允许浏览器解释glyphs。这使得本地化变得更加容易。

我应该使用什么编码?

嗯,ASCII适用于大多数说英语的人,但不适用于其他人。更多的时候你会看到ISO-8859-1,它适用于大多数西欧语言。ISO-8859的其他版本适用于西里尔语、阿拉伯语、希腊语或其他特定的脚本。但是,如果您想在同一文档或同一网页上显示多个脚本,UTF-8允许更好的兼容性。对于使用适当标点符号、数学符号或即兴字符(如正方形和复选框)的人来说,它也非常有效。

什么是字符编码像ansi和unicode,他们有什么不同?

(一个文档中包含多种语言,屏幕截图)古吉拉特邦samachar.com)

然而,每一套都有缺点。ASCII的标点符号是有限的,所以它不能很好地进行排版正确的编辑。有没有从Word中键入copy/paste只是为了得到一些奇怪的字形组合?这就是ISO-8859的缺点,或者更准确地说,它假定与操作系统特定的代码页具有互操作性(我们正在关注您,Microsoft!)。UTF-8的主要缺点是在编辑和发布应用程序时缺乏适当的支持。另一个问题是浏览器通常不解释,只显示UTF-8编码字符的字节顺序标记。这将导致显示不需要的图示符。当然,在网页上声明一种编码并使用另一种编码的字符而不正确地声明/引用它们,这使得浏览器很难正确地呈现它们,搜索引擎也很难对它们进行适当的索引。

对于你自己的文件、手稿等,你可以使用任何你需要的东西来完成工作。不过,就网络而言,似乎大多数人都同意使用不使用字节顺序标记的UTF-8版本,但这并不是完全一致的。如您所见,每个字符编码都有自己的用途、上下文以及优缺点。作为一个最终用户,您可能不必处理这个问题,但是现在如果您选择这样做,您可以向前迈出额外的一步。

  • 发表于 2021-04-09 01:48
  • 阅读 ( 245 )
  • 分类:互联网

你可能感兴趣的文章

ascii和unicode文本之间有什么区别?

ASCII和Unicode都是指文本的数字表示的标准,特别是组成文本的字符。然而,这两个标准有着显著的不同,许多属性反映了它们各自的创作顺序。 ...

  • 发布于 2021-03-28 12:00
  • 阅读 ( 426 )

电子邮件和表情符号:unicode如何帮助我们在线交流

... 要真正了解它们是什么,以及它们为什么对当今的通信如此重要,我们就必须跳进时光机回到19世纪。 ...

  • 发布于 2021-03-28 18:08
  • 阅读 ( 264 )

什么是ascii文本?它是如何使用的?

...由于一个更强大的新来者,它的使用正在迅速消失。但是什么是ASCII,它的用途是什么? ...

  • 发布于 2021-03-29 03:18
  • 阅读 ( 241 )

如何在microsoftexcel中使用trim函数

...修剪功能为您执行此操作,而不是手动删除这些功能。 什么是装饰功能(the trim function)? TRIM是一个非常简单的microsoftexcel函数,它可以从特定的文本字符串或包含文本的单元格中删除任何多余的空格,在单词之间只留下一个空...

  • 发布于 2021-03-31 14:28
  • 阅读 ( 188 )

如何在outlook中更改字符编码

...失的字符并允许您阅读邮件。下面是如何做到这一点。 什么是字符编码(character encoding)? 如果你不确定“字符编码”是什么,我们会给你一个全面的解释。不太全面的解释是,字符是当您键入某个内容时出现在屏幕上的字形。...

  • 发布于 2021-04-03 23:47
  • 阅读 ( 201 )

如何在iphone和ipad上关闭智能标点符号

...-)。聪明的标点符号让文字看起来更聪明。 那么,你为什么要关掉它? 相关:什么是字符编码像ANSI和Unicode,他们有什么不同? 不幸的是,大多数计算机工程师并不真正关心他们代码文件中的文本是什么样子的。而且,由于是...

  • 发布于 2021-04-06 16:51
  • 阅读 ( 325 )

使用自动热键脚本的初学者指南

...保存到您的硬盘–这就是我们要使用的。 一点历史:为什么有两个版本? 您可能想知道为什么下载页面同时提供自动热键和自动热键基本功能。所发生的事情是,AutoHotkey的原始开发人员决定停止对项目的工作;但AutoHotkey不会...

  • 发布于 2021-04-13 00:58
  • 阅读 ( 130 )

表情符号是如何从一个广告词到另一个产品的

...晰起见,本次采访经过了编辑和浓缩。 你在提案中做了什么样的研究?你觉得这份文件中最重要的证明是什么? 我把这两个建议放在一起,它们在研究方面有很大的不同。对于橙色的心来说,这只是一个简单的例子,陈述一个...

  • 发布于 2021-05-09 02:22
  • 阅读 ( 495 )

ansi标准(ansi)和unicode码(unicode)的区别

ANSI与Unicode ANSI和Unicode是两种字符编码,在某一点上被广泛使用。用法也是两者之间的主要区别,因为ANSI非常古老,并且被windows95/98和更旧的操作系统使用,而Unicode是一种更新的编码,目前所有的操作系统都使用它。ANSI有许...

  • 发布于 2021-06-23 11:09
  • 阅读 ( 207 )

unicode码(unicode)和ascii码(ascii)的区别

Unicode与ASCII ASCII和Unicode是两个字符编码。基本上,它们是关于如何用二进制表示不同字符的标准,以便在数字媒体中写入、存储、传输和读取。两者之间的主要区别在于它们对字符的编码方式以及各自使用的位数。ASCII最初使...

  • 发布于 2021-06-23 17:58
  • 阅读 ( 171 )
无创易
无创易

0 篇文章

相关推荐