如何使用CoreNLP的4级NER标签?

时间:2017-07-27 14:58:12

标签: command-line-interface stanford-nlp named-entity-recognition

我正在使用Stanford CoreNLP来执行一些nlp任务。更具体地说,我使用此命令

java -mx1g -cp "./stanford-corenlp-full-2016-10-31/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -outputFormat conll -file my_file.txt

执行ner标记(加上一些其他任务,如标记化和pos标记)。 有了这个,我获得的NER标签包括:DATE,NUMBER,TIME,DURATION,ORDINAL,MONEY。

我想使用仅标记为:PERSON,ORGANIZATION,LOCATION,MISC和O的Stanford NER标记器。

我应该如何修改上面的bash命令以表明我想要4-tag NER分类器?

1 个答案:

答案 0 :(得分:0)

模型jar文件中应该有一个属性文件。(中文版本是StanfordCoreNLP-chinese.properties) 您可以在属性文件

中更改NER模型文件