有没有不尊重ASCII的字符集?

时间:2017-03-27 11:59:30

标签: unicode utf-8 character-encoding character-set

据我所知,字符编码将位映射为整数,字符集将整数映射到字符。

因此在Unicode字符集中有一个电话字符。它使用整数9742表示,更常用十六进制表示为260E。然后使用UTF-8将其保存到文件中,将整数9742转换为10011000001110.如果我错了,请纠正我。

昨天我创建了一个使用Unicode字符集和UTF-8编码的文本文件,并将其保存到桌面。然后我在文本编辑器中重新打开文件,并开始手动切换字符集以获得乐趣。不出所料,有问题和奇怪的人物开始显示!我注意到只有一些角色被误传了。这让我思考,为什么只有一些人物破碎?为什么不呢?

有人告诉我,破解的字符是原始ASCII规范之外的字符。经过反思,这似乎是有道理的,因为它只是非美国角色的突破。有人告诉我,因为所有字符集使用的ASCII字符设置为前128个字符,它们将保持不间断,并且它是突破127的字符。如果我错了,请纠正我。

最后,我开始思考。有没有不尊重ASCII的字符集?如果是这样,他们叫什么,他们用什么?

1 个答案:

答案 0 :(得分:0)

根据我在评论中的发现,我能够回答我自己的问题。感谢所有评论的人!

是的,有一对; EBCDICBaudot