我需要http://www.unicode.org/Public/5.1.0/ucd/UCD.html#Alphabetic中定义的属性Alphabetic
的Unicode字符范围列表。但是,无论我如何搜索它们,我都无法在Unicode字符数据库中找到它们。有人可以提供它们的列表,还是只提供具有指定Unicode属性的字符的搜索工具?
答案 0 :(得分:12)
Unicode字符数据库包含分发中的所有文本文件。它不仅仅是很久以前的单个文件。
Alphabetic属性是派生属性。
您真的不想为此使用代码点范围。您想要正确使用属性。那是因为它们太多了。使用unichars script,我们了解到只有基本多语言平面中有超过一万个不计算Han或Hangul:
$ unichars '\p{Alphabetic}' | wc -l
10052
如果我们包括其他16架星体飞机,现在我们已经达到了一万四千架:
$ unichars -a '\p{Alphabetic}' | wc -l
14736
如果我们包括Han和Hangul,实际上是Alphabetic属性,我们只是从十万个代码点吹掉了屋顶:
$ unichars -ua '\p{Alphabetic}' | wc -l
101539
我希望您能看到不希望使用代码点范围专门枚举这些内容。走这条路是疯狂的。
顺便说一句,如果您发现unichars script有用, 你可能也喜欢uniprops script和uninames script。
答案 1 :(得分:2)
可以从其他属性计算派生核心属性。
字母属性定义为:生成自:Lu + Ll + Lt + Lm + Lo + Nl + Other_Alphabetic
因此,如果您获取Lu,Ll,Lt,Lm,Lo,Nl中的所有字符以及具有Other_Alphabetic属性的所有字符,您将具有字母字符。
答案 2 :(得分:2)
来自您的来源:Generated from: Lu + Ll + Lt + Lm + Lo + Nl + Other_Alphabetic
这些缩写似乎在解释here。
答案 3 :(得分:1)
我找到了UniView网络应用程序,它提供了一个很好的搜索界面。搜索Letter属性(使用Local unchecked)可获得14723个结果...