确定字符串是否为英语

时间:2012-04-04 15:33:30

标签: ruby-on-rails ruby string

是否有一个库我可以简单地在字符串上调用方法来查明它是否是非英语的?我试图只保存英文字符串,并且输入的字符串流中有很多非英文字符。

3 个答案:

答案 0 :(得分:2)

您可以尝试使用linguo

"your string".lang
# will return "en" for english strings

免责声明:我是这个宝石的创造者。

答案 1 :(得分:1)

您可以将GoogleTranslate API与RailsBridge一起使用 - http://code.google.com/apis/gdata/articles/gdata_on_rails.html

答案 2 :(得分:0)

不是我知道......但是你可以将这个列表放到一个数组中(http://www.langmaker.com/wordlist/basiclex.htm),然后将字符串的字符与它匹配...决定在一定比例上,从那里开始。

你甚至可以在这里使用贝叶斯算法将这些单词标记为“好”并从中学习,但这可能有点过分。