我正在为我正在研究的项目寻找各种NLP工具,现在我发现斯坦福NLP项目最有用。
有没有人知道是否有其他工具可用于语言支持者?
更重要的是,有哪些工具不在那里?
最具体地说,我正在寻找一个用于morphophoneme分析等的api。
编辑:我是一名学者(研究项目的学生),主要是寻找开源或至少开放的api项目。答案 0 :(得分:6)
我建议你看看以下内容:
我不知道有一个返回单词根的工具,但正如我所说的那样,有词干和词形变换器。要进行词形还原,请尝试Tree Tagger或Morpha。吗?语音分析是一个不够具体的术语,无法满足您的需求。
一旦您更具体地了解所需内容,就可以搜索Corpora List的档案或在那里发帖提问。
答案 1 :(得分:3)
NTLK是一个有趣的工具包,可以构建基于NLP的应用程序。这可以用于需要例如POS标记的实际应用,或者实现简单分类器或实体提取器的实际应用。
然而,我不确定“语言隐藏”应用程序会包含什么,但这听起来像是可以[很容易]基于NLTK的东西。 完全阅读这个问题及其对morphophonics的提及似乎证实了NLTK可能不会很好地服务于OP的目的;据我所知,NTLK不提供处理此级别文本的模块。你可能想亲自检查一下,因为NLTK是一个广泛而活跃的项目,可能已经看到了这个领域的最新成员。
答案 2 :(得分:3)
我想要链接到MontyLingua python包,可以在这里找到。我认为它使用与nltk不同的解析器。
http://www.fslog.com/2008/09/20/montylingua3-gpled-fork-of-montylingua/ 你可以谷歌与nltk进行比较。
答案 3 :(得分:1)
Maluuba刚刚向他们的自然语言处理器发布了一个API。它可以在http://developer.maluuba.com获得。
Maluuba为它编写了三个库:
Python库:https://github.com/maluuba/napi-python
Ruby Library:https://github.com/maluuba/napi-ruby
Java Library:https://github.com/maluuba/napi-java
有关它的强大功能的示例,请将此查询作为可提取内容的示例:
>> client.interpret phrase: 'Set up a meeting with Bob tomorrow \
night at 7 PM to discuss the TPS reports'
=>
{:entities=>
{
:daterange=>[{:start=>"2012-11-15", :end=>"2012-11-16"}],
:title=>["meeting to discuss the tps reports"],
:timerange=>[{:start=>"12:00:00AM", :end=>"12:00:00AM"}],
:contacts=>[{:name=>"bob"}]
},
:action=>:CALENDAR_CREATE_EVENT,
:category=>:CALENDAR
}