CJK字符集的正则表达式的类比是什么? ASCII或拉丁字母字符在质量上与CJK字符有什么不同?
答案 0 :(得分:1)
CJK字符集的正则表达式的类比是什么?
正则表达式。它始终能够处理不同的字符集,但使用Unicode会变得更加简单和可靠。
您使用的语言/环境是什么?通常,现代实现都支持Unicode字符,但有些可能缺少像\p{...}
这样的扩展功能用于字符类。
ASCII或拉丁字母字符在质量上与CJK字符有什么不同?
CJK表意文字和音节不具有大写和小写,因此它们是“Letter,Other”类别的成员,而不是大多数拉丁字母的“Letter,Uppercase”或“Letter,Lowercase”。它们也具有不同的断线特性。