在.NET中是否有办法根据输入字符串确定脚本系列?例如,我有以下内容:
咖啡,กาแฟ,コーヒー,قهوة
(分别为中文,泰文,日文和阿拉伯文的“咖啡”)
有没有办法确定这些脚本是什么,例如一般脚本系列(例如,它可能是“Hans / Hant”,“Thai”,“Jpan”,“Arab”) - 这些是{{ 3}} / IANA分组?
答案 0 :(得分:3)
我遇到了类似的问题(检测字母/脚本以计算单词)我最后检查每个字符以查看它包含在哪个Unicode块中,从而确定如何处理它。基本上,您可以在分开的Unicode块中定义不同的中文,日文,阿拉伯文和泰文“字母”。