Question

我一直在玩http://corenlp.run/并注意到它区分大小写。例如，它将“i”标记为FW而将“I”标记为PRP。我可以训练它忽略案例吗？更一般地说，我如何针对不完善的句子进行训练？

Answer 1

CorenNLP具有不区分大小写的模型，您只能使用英语。他们称他们为caseless models。如果您使用的是版本3.6.0，请阅读那里的警告

链接中提到的几点：

您可以修复文本中的字母大小写并使用普通模型。您可以使用TrueCaseAnnotator。
要使用CoreNLP训练您自己的不区分大小写的模型，您可以指定忽略大小写的令牌预处理器
```
wordFunction = edu.stanford.nlp.process.LowercaseFunction
```