需要的各种字符的特殊字符分类列表

时间:2010-05-10 09:18:38

标签: php javascript unit-testing testing

我正在开发一个Web应用程序,它与机器翻译支持有关 即采用源文本进行翻译并翻译成用户指定的语言

目前处于单元测试阶段。

在这里,我想检查一下,我的机器翻译功能是否完全适用于所有特殊字符。 由于不同的测试用例,我卡在一个点上,我需要所有带分类的特殊字符。

我需要列出分类的所有特殊字符。

e.g。

第一名:

  

班级名称:标点符号

     

字符:!?,“| etc

     

测试用例:segment1?分段2!   段3。

第二名:

  

班级名称:HTML实体

     

字符:所有字符   属于这一类

     

测试用例:各个测试用例

第3名:

  

班级名称:扩展ASCII

     

字符:所有字符   属于这一类

     

测试用例:各个测试用例

请大家提供这个,如果有人有任何想法或链接,以便我可以使产品完美

非常感谢

1 个答案:

答案 0 :(得分:0)

您的问题有点模糊,但一般来说,在Unicode世界中,字符按分配给它们的“属性”进行分类。有关基本属性列表,请参阅此php manual page