任务是对字符串列表进行排序。优先考虑特定语言。 字符串可以用不同的语言编写。 如中文,英文,俄文。 我需要首先接受所有中国人,然后是其他人。
为此,我想知道哪个国家/地区(语言)属于字符串中的特定字符。 ( 例如,在第一个字母上)
是否有任何课程或方法?
答案 0 :(得分:4)
如果我们正在讨论字母表,那么你可以通过强制转换来检查char的int表示:
int unicodeValue = (int)myString[0];
然后使用this one这样的表格检查它是否在语言范围内
例如,丐
为19984
,十六进制为4E10
(19984.ToString("X")
),使其成为 CJK Unified Ideographs 。它看起来像是汉字的类别,但你需要深入挖掘并确保它。
现在,如果我们正在讨论确定哪个语言是特定单词,那么您需要查看Soundex算法。
答案 1 :(得分:1)
试试此链接
How to detect the language of a string?
代码是(已复制)
var text = "¿Dónde está el baño?";
google.language.detect(text, function(result) {
if (!result.error) {
var language = 'unknown';
for (l in google.language.Languages) {
if (google.language.Languages[l] == result.language) {
language = l;
break;
}
}
var container = document.getElementById("detection");
container.innerHTML = text + " is: " + language + "";
}
});