哪个短语提取工具现在是最先进的?

时间:2012-03-24 17:48:51

标签: nlp information-extraction

我知道以下开源工具,但我没有找到它们分别有多好的比较。 准备使用短语提取的工具:

  • KEA
  • MAUI(http://code.google.com/p/maui-indexer/)<< li>
  • Dragon,xTract(http://dragon.ischool.drexel.edu/xtract.asp)
  • Lingpipe(http://alias-i.com/lingpipe/demos/tutorial/interestingPhrases/read-me.html)
  • Mahout(https://cwiki.apache.org/MAHOUT/collocations.html)
  • 其他

有没有人见过这样的比较?

2 个答案:

答案 0 :(得分:4)

MAUI在我的实验中胜过KEA。 对无监督自动关键短语提取方法进行了比较(Coling 2010论文)。但他们没有分析监督方法,我打算在不久的将来这样做。

此外,我还研究了一系列更丰富的功能,这些功能改善了自动关键短语提取的性能,这仍然远非完美。我可能会在明年发布带有这些扩展的MAUI的扩展版本。

请阅读以下文件或发送电子邮件给我更多详情:

Supervised Topical Key Phrase Extraction of News Stories using Crowdsourcing, Light Filtering and Co-reference Normalization

Keyphrase Cloud Generation of Broadcast News

答案 1 :(得分:0)

我喜欢Mallet,因为它有一个非常易于使用的命令行工具