从C#中自由流动的字符串中提取名词和形容词的算法

时间:2015-01-22 06:08:10

标签: c# algorithm nlp

我正在开展一个项目,在这个项目中我被困在一个部分,我必须从自由流动的文本中找到所有的名词和形容词。我搜索并发现了一些算法,但在实现方面遇到了很多困难。所以我需要一个API或有效的算法来实现这一目标。

1 个答案:

答案 0 :(得分:1)

您需要一种所谓的词性(POS)标记的算法。通常,这些算法是统计的,您不能指望完美的性能。其他人试图根据语言语法解析句子,但在现实生活中并非所有句子都是语法。而且,存在新颖的(即,程序未知的)单词的大问题。例如,你会完全理解一个人为的句子中的词性“moobza klucked a blone”,但不是每个算法都会。

在实践方面,请查看Stanford NLP软件,该软件也有a .NET interface。它有一个非常成熟且性能良好的POS标签。