我如何知道某个特定语言的角色?在Unicode字符串中

时间:2013-01-25 17:02:24

标签: c# string unicode

  

可能重复:
  Return the language of a given string

任务是对字符串列表进行排序。优先考虑特定语言。 字符串可以用不同的语言编写。 如中文,英文,俄文。 我需要首先接受所有中国人,然后是其他人。

为此,我想知道哪个国家/地区(语言)属于字符串中的特定字符。 ( 例如,在第一个字母上)

是否有任何课程或方法?

2 个答案:

答案 0 :(得分:4)

如果我们正在讨论字母表,那么你可以通过强制转换来检查char的int表示:

int unicodeValue = (int)myString[0];

然后使用this one这样的表格检查它是否在语言范围内 例如,19984,十六进制为4E1019984.ToString("X")),使其成为 CJK Unified Ideographs 。它看起来像是汉字的类别,但你需要深入挖掘并确保它。

现在,如果我们正在讨论确定哪个语言是特定单词,那么您需要查看Soundex算法。

答案 1 :(得分:1)

试试此链接

How to detect the language of a string?

代码是(已复制)

var text = "¿Dónde está el baño?";
google.language.detect(text, function(result) {
if (!result.error) {
var language = 'unknown';
for (l in google.language.Languages) {
  if (google.language.Languages[l] == result.language) {
    language = l;
    break;
  }
}
var container = document.getElementById("detection");
container.innerHTML = text + " is: " + language + "";
}
});