Stanford Parser可以忽略案例吗?

时间:2017-04-21 19:06:26

标签: stanford-nlp stanford-parser

我一直在玩http://corenlp.run/并注意到它区分大小写。 例如,它将“i”标记为FW而将“I”标记为PRP。 我可以训练它忽略案例吗?更一般地说,我如何针对不完善的句子进行训练?

1 个答案:

答案 0 :(得分:2)

CorenNLP具有不区分大小写的模型,您只能使用英语。他们称他们为caseless models。如果您使用的是版本3.6.0,请阅读那里的警告

链接中提到的几点:

  1. 您可以修复文本中的字母大小写并使用普通模型。您可以使用TrueCaseAnnotator
  2. 要使用CoreNLP训练您自己的不区分大小写的模型,您可以指定忽略大小写的令牌预处理器

    wordFunction = edu.stanford.nlp.process.LowercaseFunction