如何从奇异形式获得复数形式?

时间:2014-03-23 09:53:20

标签: java nlp stanford-nlp lemmatization inflector

我想获得给定名词的复数。我试过JAVA INFLECTOR。但是,对于不遵循常规规则的名词,它的准确性很差。

来自JAVA INFLECTOR的

示例:

  1. paparazzo - > paparazzos
  2. 标准 - >判据
  3. 牙齿 - > tooths
  4. 小偷 - > thiefs
  5. loaf - >游荡
  6. Stanford coreNLP lemmatizer非常擅长复数到奇异转换。它处理了许多特殊情况。如下所述:

    STANFORD LEMMATIZER的单数形式

    1. 顶点 - >顶点
    2. 光谱 - >光谱
    3. 校友 - >校友
    4. 条件 - >标准
    5. 小偷 - >贼
    6. 鹅 - >鹅
    7. 真菌 - >真菌
    8. 面包 - >面包。
    9. 但问题是我不知道如何使用Stanford CoreNLP从单数形式获得复数。引理器从复数形式给出单数。

      所以,基本上我想使用STANFORD NLP从单数名词中获取复数。

      如何实现这一目标?

1 个答案:

答案 0 :(得分:-2)

如果您可以利用javascript,我为此创建了一个轻量级的JavaScript。非常好用:

pluralizer.run('goose') --> 'geese'
pluralizer.run('deer') --> 'deer'
pluralizer.run('can') --> 'cans'

https://github.com/rhroyston/pluralizer-js