我正在使用Stanford CoreNLP来执行一些nlp任务。更具体地说,我使用此命令
java -mx1g -cp "./stanford-corenlp-full-2016-10-31/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -outputFormat conll -file my_file.txt
执行ner标记(加上一些其他任务,如标记化和pos标记)。 有了这个,我获得的NER标签包括:DATE,NUMBER,TIME,DURATION,ORDINAL,MONEY。
我想使用仅标记为:PERSON,ORGANIZATION,LOCATION,MISC和O的Stanford NER标记器。
我应该如何修改上面的bash命令以表明我想要4-tag NER分类器?
答案 0 :(得分:0)
模型jar文件中应该有一个属性文件。(中文版本是StanfordCoreNLP-chinese.properties) 您可以在属性文件
中更改NER模型文件