如何使用Wordnet或任何其他NLP工具找到形容词的根?

时间:2013-01-30 06:13:05

标签: java nlp wordnet

我需要用词干来获得根词。我能够得到名词和动词的词干,但无法得到形容词的根词。

    WordnetStemmer stem =  new WordnetStemmer(ws.getDictionary());
    System.out.println("test" + stem.findStems("shooting",POS.VERB) );
    System.out.println("test" + stem.findStems("gunshots",POS.VERB) );

以下是有效的,但是当我尝试使用形容词时却没有。有没有办法阻止一个形容词或得到它的根形式?

提前致谢。

1 个答案:

答案 0 :(得分:0)

WordnetStemmer已作为SimpleStemmer

的扩展实施

所以绝对有办法阻止ADJECTIVES。如果词干分析器没有找到该词,它将不会返回任何词干。

您有几个选择:

  1. 调用findStems时,您可以将POS保留为Null,在这种情况下,它将返回所有词性的词干。请参阅文档here

  2. 请尝试拨打SimpleStemmer。从Rules of Detachment可以看出,许多形容词都被处理了,但stemmer将无法处理大量的形容词。

  3. 一些形容词词干的样本:

    ADJ "er" ""
    ADJ "est" ""
    ADJ "er" "e"
    ADJ "est" "e" 
    

    希望能帮助你前进。