有没有办法判断unicode字符是控件,alpha,数字还是符号?

时间:2010-01-02 19:37:50

标签: string algorithm language-agnostic unicode character-properties

假设您拥有的只是二进制数据且没有预先设定的函数,是否有模式或算法来对字符类型进行分类?

3 个答案:

答案 0 :(得分:8)

您要求API告诉您。在Java中,您使用Character类。在C ++中,您可以使用ICU。如果您的语言没有,请从unicode.org下载属性数据库并将其合并。

换句话说,没有模式或算法。 Unicode联盟发布了包含信息的表格。

答案 1 :(得分:1)

不,没有模式。您需要创建一些查找表。 (好吧,我想你可以用if的迷宫做到这一点,但这不会很好。)

幸运的是,在大多数环境中, 是一个预先封装的API函数,可以为您完成,因为构建字符类数据表非常无聊。

答案 2 :(得分:1)

我最近发布了我的FOSS Unicode转换器,我正在使用最新的Unicode字符数据库(附件#44 - 包含Unicode 5.2)

在此(XML)数据库中,您可以搜索所请求的字符(十六进制代码)并查看它是否为数字或任何您想要的内容。

你可以在我的项目中测试这个,如果有用,你可以使用它的数据库

http://unicode.codeplex.com是该项目的主要存储库。你可以看到代码或在那里获得可执行文件