我很好奇过去它实现的方式,我希望获得有关如何实现自己的字符集的信息。
答案 0 :(得分:0)
ASCII(美国信息交换标准码)是"原始" characterset,仍然是大多数文本数据的基础。 ASCII实际上是一个7位代码(数值范围从0到127),其中一个字节的最高位指示字节的其余部分是指ASCII(如果为零)还是当前代码页。
然后将额外(非ascii)字符添加到这些代码页中,并且用户的计算机将加载要使用的特定代码页。不幸的是,这意味着您需要在查看文件之前加载正确的代码页,否则会出现错误的字符。
我们现在已经开始了,并且大多数系统都使用Unicode,这是一个可变字符长度(而不是之前使用的单字节字符),它可以包含数千个字符,允许单个编码来满足要求使用旧的ASCII + Codepage方法已经有多个代码页。
这是简史;至于如何创建自己的角色,我不确定你想要实现什么 - 你可以创建自己的字体,但如果你正在谈论一个真正的字符集(即不存在的字符) )然后你必须将你的字符集添加到Unicode之类的标准中,以便其他计算机可以使用你的新字符,这将是相当多的工作(我不知道你是怎么做的)。然而,值得考虑的是,现在几乎所有存在的字符都存在于Unicode中,因此您可能想要在尝试拍摄猛犸象之前查看已经完成的内容承担诸如创造一个全新的角色。