给定一个字符(字符串的一个字母),我如何识别它属于哪种语言?选项包括:英语,俄语,希伯来语。
背景:用户在表单中输入此字符,然后将其存储在数据库中。
例如,可以是其中一个词中的第一个字母:
答案 0 :(得分:3)
UNICODE 标准分为“块”。去这里:
http://www.unicode.org/charts/
http://en.wikipedia.org/wiki/Unicode_block
http://www.unicode.org/versions/Unicode6.0.0/
找到每种语言的unicode块(间隔)。
我的猜测:
对于你来说,每个字符(unicode ordinal value)的简单数字比较问题。非常简单。