Unicode字母字符列表

时间:2011-01-30 14:13:30

标签: unicode alphabetic character-properties

我需要http://www.unicode.org/Public/5.1.0/ucd/UCD.html#Alphabetic中定义的属性Alphabetic的Unicode字符范围列表。但是,无论我如何搜索它们,我都无法在Unicode字符数据库中找到它们。有人可以提供它们的列表,还是只提供具有指定Unicode属性的字符的搜索工具?

4 个答案:

答案 0 :(得分:12)

Unicode字符数据库包含分发中的所有文本文件。它不仅仅是很久以前的单个文件。

Alphabetic属性是派生属性。

您真的不想为此使用代码点范围。您想要正确使用属性。那是因为它们太多了。使用unichars script,我们了解到只有基本多语言平面中有超过一万个计算Han或Hangul:

$ unichars '\p{Alphabetic}' | wc -l
   10052

如果我们包括其他16架星体飞机,现在我们已经达到了一万四千架:

$ unichars -a '\p{Alphabetic}' | wc -l
   14736

如果我们包括Han和Hangul,实际上是Alphabetic属性,我们只是从十万个代码点吹掉了屋顶:

$ unichars -ua '\p{Alphabetic}' | wc -l
  101539

我希望您能看到希望使用代码点范围专门枚举这些内容。走这条路是疯狂的。

顺便说一句,如果您发现unichars script有用, 你可能也喜欢uniprops scriptuninames script

答案 1 :(得分:2)

可以从其他属性计算派生核心属性。

字母属性定义为:生成自:Lu + Ll + Lt + Lm + Lo + Nl + Other_Alphabetic

因此,如果您获取Lu,Ll,Lt,Lm,Lo,Nl中的所有字符以及具有Other_Alphabetic属性的所有字符,您将具有字母字符。

答案 2 :(得分:2)

来自您的来源:Generated from: Lu + Ll + Lt + Lm + Lo + Nl + Other_Alphabetic

这些缩写似乎在解释here

答案 3 :(得分:1)

我找到了UniView网络应用程序,它提供了一个很好的搜索界面。搜索Letter属性(使用Local unchecked)可获得14723个结果...