以编程方式确定汉字中的笔画数量?

时间:2010-03-07 22:53:08

标签: unicode character-encoding cjk

Unicode是否存储有关中文,日文或其他基于笔划的字符的笔划计数信息?

5 个答案:

答案 0 :(得分:11)

Unihan.zip发布了Unicode Consortium这个由Unihan Database Lookup发布的文件,其中包含多个文本文件,其中包含Unihan_RadicalStrokeCounts.txt,可能就是您想要的内容。根据此数据,还有一个在线{{3}}。

答案 1 :(得分:3)

在Python中有一个库:

>>> from cjklib.characterlookup import CharacterLookup
>>> cjk = CharacterLookup('C')
>>> cjk.getStrokeCount(u'日')
4

免责声明:我写了

答案 2 :(得分:2)

你的意思是,它是否以某种方式在实际代码点编码?不可以。你可以在网上找到一个表(或者创建一个表),但它不是存储这种元数据的Unicode命令的一部分。

答案 3 :(得分:1)

如果你想做字符识别护目镜HanziDict。

另请查看Unihan数据网站:

http://www.unicode.org/charts/unihanrsindex.html

您可以查找笔画数,然后获取角色信息。你或许可以建立自己的查找。

答案 4 :(得分:0)