我一直在玩http://corenlp.run/并注意到它区分大小写。 例如,它将“i”标记为FW而将“I”标记为PRP。 我可以训练它忽略案例吗?更一般地说,我如何针对不完善的句子进行训练?
答案 0 :(得分:2)
CorenNLP具有不区分大小写的模型,您只能使用英语。他们称他们为caseless models。如果您使用的是版本3.6.0,请阅读那里的警告
链接中提到的几点:
TrueCaseAnnotator
。要使用CoreNLP训练您自己的不区分大小写的模型,您可以指定忽略大小写的令牌预处理器
wordFunction = edu.stanford.nlp.process.LowercaseFunction