在c#中查找字符串的语言

时间:2011-09-21 08:06:29

标签: c#

  

可能重复:
  Return the language of a given string

在我的程序中,我必须找到输入字符串的语言。 例如,如果用户输入

 "hello world" 

检测到的语言是英语,如果用户输入

"RUE"

应该是法国人。

目前,在我的项目中,用户可以输入法语或英语。

我尝试过使用CultureInfo课程,但我没有取得任何成果。

4 个答案:

答案 0 :(得分:1)

我认为您需要包含语言词典,然后匹配单词enter以预测提供输入的准确语言。

TextCat非常适合语言识别。它有很多不同语言的实现。

Ivan Akcheurov已生成一个没有端口的版本,可以找到HERE

它是纯.Net Framework dll +命令行界面。它与TextCat的74种语言模型完全兼容,因此它能够开箱即用地检测语言。

答案 1 :(得分:0)

没有功能的构建,这不是一项微不足道的任务,而是看看this question and answer。如果你有足够大的学习基础,那么它可以用来确定写入文本的语言。它总是最好的猜测,因为一些文本,如医学英语,使用了很多你在法语文本(或者至少在文字用英语写的时候比Franch更接近英文的地方)

确定语言有多困难的一个很好的例子,特别是当文本很短时实际上是“芸芸”。它是法国街道,但也是至少4个不同国家的城市,所以有五种可能的语言。一个是法国人,一个是英国人。 (弗吉尼亚州的街区有一个小镇)

答案 2 :(得分:0)

.NET中没有这样的内置功能,所以你需要自己实现它(这在资源方面是非常昂贵的)或者试图利用google translate这样的公共服务(或者可能不会对这项任务有用。

答案 3 :(得分:0)

Google Translate API支持检测字符串的语言。这是paid service,但可能物有所值。