阅读历史 |

第七百四十二章 新方案(2 / 2)

加入书签

得能够解决问题才算。

“为什么不用UNICODE呢?”

“UNICODE?”李红江想了一下:“UNICODE八字还没一撇吧?国际标准都还没有出来,我们哪来的参照?”

Unide的汉语翻译,叫做统一码,也叫万国码、单一码,是由统一码联盟开发的一项计算机科学领域里的业界标准,主要就包括字符集和编码方案。

统一码是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符,设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

统一码设计之初的目的,就是为了打造一个能够容纳世界上所有文字和符号的字符编码方案。

其设计思路,就是用数字0-0x10FFFF来映射所有字符,最多可以容纳1114112个字符,或者说有1114112个码位。

后世大家所熟悉的UTF-8、UTF-16、UTF-32,其实都是将数字转换到程序数据的编码方案。

当然这些码位也不是随便乱用的,而是规定了区间,比如上一世给汉字使用的区间,就是3400-4DBF,4E00-9FFF,20000-3FFFF三段,称作:中日韩越统一表意文字区间。

这就有一百多万个码位,装下所有汉字绰绰有余。..

因为不存在上限,UTF理论上还可以继续扩展。

当然从上一世的经验来看,也完全没有这个必要,足够用了。

↑返回顶部↑

书页/目录