重新制定斯坦福coreNLP Lemmatizer

时间:2018-02-12 11:46:51

标签: java nlp stanford-nlp javadoc lemmatization

我正在试图弄清楚这个词形变换器如何支持识别例如识别例子的特定用例。语料库中的某些区域变体。我可以遵循的两种可能方法是:

  • 修改现有字典以使用我自己的资料,或
  • 重新训练lemmatizer

我想知道您是否可以指出我可以遵循任何一种方法的文档。我知道Lemma模块以这种方式工作:

PropertiesUtils.asProperties(
    "annotators", "tokenize,ssplit,pos,lemma",
    "ssplit.isOneSentence", "true",
    "tokenize.language", "en"));

除了CoreAnnotations.LemmaAnnotation之外,我无法追踪我想做的事情。我很感激您提供的任何帮助。

非常感谢

0 个答案:

没有答案