NLP:形态学操纵

时间:2009-03-17 21:35:53

标签: nlp

我正在尝试为作业建立一个NLP系统,我可以使用外部库 我正在使用解析树将句子分解为它们的组成部分,直到名词,动词等 我正在寻找一个图书馆或软件,可以让我识别出一个单词所在的词汇形式,并可能为我翻译成其他形式。
基本上,我需要一些像isPlural,singularize,getInfinitive等函数的东西 我考虑过Ruby Linguistics包和一个简单的Porter Stemmer(用于不定式),但两者都不是很好。
这似乎不是一个非常困难的问题,只是非常繁琐 有没有人知道一个好的包/库/软件可以做那样的事情?

1 个答案:

答案 0 :(得分:1)

通常,为了构建句子的解析树,首先需要确定句子中单词的词性和引理信息。所以,你应该已经掌握了这些信息。

但无论如何,为了将字形映射到它们的引理,并从引理中合成字形,请查看morpha and morphg,以及Java版本(或前端到){{1} } SimpleNLG package中包含的内容。有morphggetInfinitive等方法。 API for the Verb class