有趣的奇怪(unicode)字符占用多行

时间:2013-12-23 01:28:15

标签: unicode character-encoding zalgo

我在社交媒体中找到了一些“有趣”的人物(例如ḓ̵̙͎̖̯̞̜̞̪̠和•̩̩̩̩̩̩̩̩̩̩),这些人物不止一行。首先我认为这是Firefox的错误。我在Gedit和LibreOffice Writer中试过这个,它们都是一样的。那么,这实际上是什么?其实我在询问字符编码和渲染。

我试图找到GNOME字符映射中的字符,但找不到它们。

我试图用unicode(可能是UTF-8)检查它们的字符代码。看起来他们需要不止一个角色。为什么一个角色 多个角色?这是使用Python的结果。

字符ḓ̵̙͎̖̯̞̜̞̪̠

u'\u2022\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329
\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329'

字符•̩̩̩̩̩̩̩̩̩̩

u'\u1e13\u0335\u0319\u034e\u0316\u032f\u031e\u031c\u031e\u032a\u0320\u033c\u031e
\u0320\u034e\u033c\u0353\u034b\u036e\u034c\u0346\u0300\u035c\u0345'

1 个答案:

答案 0 :(得分:1)

U + 0329是COMBINING VERTICAL LINE BELOW。它是一个组合字符(除了U + 2022和U + 1E13之外,所有其他字符都是如此),这意味着它与前一个字符结合。你在这里看到的仅仅是某人在同一个基地上堆叠太多组合字符的结果。