我目前正在研究文本分析,并且正在使用Stanford-CoreNLP 3.9.1。
这是我的代码:
Properties properties = new Properties();
properties.put("annotators", "tokenize,ssplit,truecase,pos,lemma");
properties.put("truecase.overwriteText", "true");
StanfordCoreNLP pipeline = new StanfordCoreNLP(properties);
Annotation document = new Annotation(myText);
pipeline.annotate(document);
当我在文本上执行此代码时
请勿在火花或热源附近使用这些材料。
或
请勿在它们之间混合油脂。
“ SPARKS” 和“油脂” 标记为VBZ(动词,第三人称单数形式),而不是NNS(名词,复数形式)。
是否有解决此问题的配置?
谢谢。