什么是字符编码使用?

时间:2012-02-16 11:06:43

标签: character-encoding byte

奇数字符代码:

  

ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้

问题: 这些字符的编码是什么?


(提示:尝试编辑这个问题,你会明白为什么他们很奇怪,LIVE)

是的,那是对的。你看到我做同样的事情。
显然,这来自mac。因此,由于对我所涉及的主题知之甚少,我启动了记事本++并尝试以十六进制查看。

结果呢?亲自尝试:http://notepad-plus-plus.org/

相当明显;我勒个去? 我可以理解它是否是Just a Bunch of Bits在一些奇怪的专有二进制编码中(包含颜色,字体等等)。但为什么他们出现这么奇怪?

另外,为什么记事本++从一开始就不显示原始字符?如果打开十六进制编辑器然后将其关闭,就像扩展一样。


(同样(再次),尝试将上述字符两次复制粘贴到记事本++中。看到区别?除了0x3f和偶尔0x20之外什么都没有对于每个角色来说也是如此。据我所知,空格和问号看起来都不像上面的字符。但是哦,我当然可能是错的......)

以下是outlook的片段:

Do you see that?!?!

编辑:使用UTF-8而不是愚蠢的ANSI编辑这些字符实际上可以让您看到正确的字节。

编辑2:当我写这个问题时,我可能应该更清楚我想知道的事情(在我的辩护中,我是如此愚蠢,我只想尖叫{{1}当我看到它时[截图])。

编辑3:(从雅虎答案复制) 它似乎是一种使用泰语字符的“堆叠变音符号”。

基本上泰语字符“ko kai”可以有几个上标的变音符号,例如ma“maitaikhu”。如果你用“maitaikhu”跟随“ko kai”,后者就会显示为上标:ก็

如果你在这样的组合之后再加上变音符号,它们就会叠加:ก็็็็็

以下是将要执行此操作的字符:http://graphemica.com/search?q=%E0%B8%81 ...

2 个答案:

答案 0 :(得分:8)

轻松搜索gnome charmap:

U+0E01 THAI CHARACTER KO KAI

General Character Properties

In Unicode since: 1.1
Unicode category: Letter, Other

Various Useful Representations

UTF-8: 0xE0 0xB8 0x81
UTF-16: 0x0E01

C octal escaped UTF-8: \340\270\201
XML decimal entity: ก

后跟(一个或多个变体):

U+0E47 THAI CHARACTER MAITAIKHU

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xE0 0xB9 0x87
UTF-16: 0x0E47

C octal escaped UTF-8: \340\271\207
XML decimal entity: ็

Annotations and Cross References

Alias names:
 • mai taikhu

第二个是装饰第一个字符的非间距标记

答案 1 :(得分:3)