如何在Ruby / Rails中识别字符的语言?

时间:2011-05-10 13:27:53

标签: ruby-on-rails ruby ruby-on-rails-3

给定一个字符(字符串的一个字母),我如何识别它属于哪种语言?选项包括:英语,俄语,希伯来语。

背景:用户在表单中输入此字符,然后将其存储在数据库中。

例如,可以是其中一个词中的第一个字母:

  • 你好
  • Привет
  • שלום

1 个答案:

答案 0 :(得分:3)

UNICODE 标准分为“”。去这里:

http://www.unicode.org/charts/

http://en.wikipedia.org/wiki/Unicode_block

http://www.unicode.org/versions/Unicode6.0.0/

找到每种语言的unicode块(间隔)。

我的猜测:

对于你来说,每个字符(unicode ordinal value)的简单数字比较问题。非常简单。