这些是一个单一的UTF-8字符吗?

时间:2017-10-11 18:50:35

标签: unicode utf-8

我希望能够以编程方式将这些字符插入剪贴板。他们每个人都是一个单一的UTF-8角色吗?如果没有,它们的编码是什么? 我在拉丁字母下查看UTF-8字符表http://www.utf8-chartable.de/unicode-utf8-table.pl,但无法找到它们。

一个 一个 一个 一个 一个 ü ü ü ü ü Ø Ø Ø Ë Ë ë

1 个答案:

答案 0 :(得分:0)

您在问题中链接的字符表仅涵盖Unicode的Basic Latin(U + 0000..U + 007F)和Latin-1 Supplement(U + 0080..U + 00FF)块中的代码点。您显示的每个字符都是Unicode的Latin Extended Additional块(U + 1E00..U + 1EFF)中的代码点。以UTF-8编码时,这些字符各占3个字节,如下所示:

= U + 1EA4 = E1 BA A4

= U + 1EA6 = E1 BA A6

= u + 1EA8 = E1 BA A8

= U + 1EAA = E1 BA AA

= U + 1EAC = E1 BA AC

= U + 1EE8 = E1 BB A8

= U + 1EEA = E1 BB AA

= U + 1EEC = E1 BB AC

= U + 1EEE = E1 BB AE

= U + 1EF0 = E1 BB B0

= U + 1EE0 = E1 BB A0

= U + 1EE2 = E1 BB A2

= U + 1EDE = E1 BB 9E

= U + 1EC0 = E1 BB 80

= U + 1EC2 = E1 BB 82

= U + 1EC4 = E1 BB 84

根据您的平台,您可能会或可能无法在剪贴板上存储UTF-8。例如,在Windows上,您只能将文本存储为ANSI或UTF-16(除非您创建自定义剪贴板格式以保存UTF-8)。