如何检测给定文本的语言

时间:2011-05-05 12:33:59

标签: ruby-on-rails ruby ruby-on-rails-3 language-detection

在我的Rails 3应用程序中,用户可以在论坛中编写消息。我想确定给定消息的语言是什么。我对英语,俄语和希伯来语感兴趣。 Ruby / Rails中是否有任何用于此类任务的内置库?如果没有,任何想法将不胜感激。

8 个答案:

答案 0 :(得分:6)

使用此:https://github.com/nashby/wtf_lang

"ruby is so awesome!".lang # => "en"
"ruby is so awesome!".full_lang # => "ENGLISH"

答案 1 :(得分:5)

您可以使用谷歌提供的API通过谷歌翻译来猜测它。

请参阅此处了解文档:http://code.google.com/apis/language/translate/v1/using_rest_langdetect.html

答案 2 :(得分:2)

由于您关注的是具有不同字符集的语言,因此您可以挖掘出主要位于字符串中的字符代码。然后,您可以看到它们是否属于代表希伯来语/加密字符的代码集。

答案 3 :(得分:1)

答案 4 :(得分:1)

也许你可以看看whatlanguage宝石?

答案 5 :(得分:1)

Language Detection API提供Ruby GEM来检测语言。

答案 6 :(得分:0)

答案 7 :(得分:0)

http://rubygems.org/gems/prose散文剂量没有宝石。试试吧。