CJK字符集的正则表达式的类比是什么?

时间:2012-08-18 00:38:26

标签: regex unicode character-encoding pattern-matching cjk

CJK字符集的正则表达式的类比是什么? ASCII或拉丁字母字符在质量上与CJK字符有什么不同?

1 个答案:

答案 0 :(得分:1)

  

CJK字符集的正则表达式的类比是什么?

正则表达式。它始终能够处理不同的字符集,但使用Unicode会变得更加简单和可靠。

您使用的语言/环境是什么?通常,现代实现都支持Unicode字符,但有些可能缺少像\p{...}这样的扩展功能用于字符类。

  

ASCII或拉丁字母字符在质量上与CJK字符有什么不同?

CJK表意文字和音节不具有大写和小写,因此它们是“Letter,Other”类别的成员,而不是大多数拉丁字母的“Letter,Uppercase”或“Letter,Lowercase”。它们也具有不同的断线特性。