未知的角色ı̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨

时间:2011-09-29 14:54:28

标签: character-encoding fonts

这是一个有点愚蠢的问题,但我今天偶然发现了这个奇怪的“角色”̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̸̨̨̨̨̨̨̨̨尝试在文本编辑器中复制它,你会看到你必须多次按退格键才能删除它=>我想实际上有几个字符,但我不知道如何进一步分析它。

有什么想法吗?

由于

1 个答案:

答案 0 :(得分:3)

使用十六进制编辑器查看原始字符数据。您的示例包括三个具有特殊含义的多字节字符。你走了:

 ‍̸

U+0338 COMBINING LONG SOLIDUS OVERLAY

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xCC 0xB8
UTF-16: 0x0338

C octal escaped UTF-8: \314\270
XML decimal entity: ̸

Annotations and Cross References

Alias names:
 • long slash overlay

----------------------

‍̨

U+0328 COMBINING OGONEK

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xCC 0xA8
UTF-16: 0x0328

C octal escaped UTF-8: \314\250
XML decimal entity: ̨

Annotations and Cross References

Alias names:
 • nasal hook

Notes:
 • Americanist: nasalization
 • Polish, Lithuanian

See also:
 • U+02DB OGONEK

----------------------

ı

U+0131 LATIN SMALL LETTER DOTLESS I

General Character Properties

In Unicode since: 1.1
Unicode category: Letter, Lowercase

Various Useful Representations

UTF-8: 0xC4 0xB1
UTF-16: 0x0131

C octal escaped UTF-8: \304\261
XML decimal entity: ı

Annotations and Cross References

Notes:
 • Turkish, Azerbaijani
 • uppercase is U+0049 LATIN CAPITAL LETTER I

See also:
 • U+0069 LATIN SMALL LETTER I

我发现这是使用十六进制编辑器和显示字符映射的程序。也许你可以自己完成它。前两个是叠加字符,这就是为什么你必须多次击退退格(它们不会在文本中生成空格;它们正在修改前一个字符的外观)。

角色在你的文字中做了什么没人在这里可以告诉你。你必须自己找到它。 (也许是文本文件中的随机二进制数据?)