使用Stanford NER在多个文件上标记NE

时间:2012-06-04 12:44:50

标签: named-entity-recognition

我想使用Stanford NER在多个文件中标记名称实体。在文档中,我们可以使用选项-testFiles和用逗号分隔的测试文件列表,但在我的情况下它不起作用:

java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier
     -loadClassifier ner-model.ser.gz -testFiles Test_file1.tsv,Test_file2.tsv

但是当我们只输入一个文件时它会起作用。

系统是否还对所有多个文件进行内联评估(FOR P,R)?我只是想知道在多个文件的情况下它是如何工作的。

提前致谢。

Khadaka

1 个答案:

答案 0 :(得分:1)

您必须使用prop.txt文件才能使用多个tsv文件。检查此链接

https://nlp.stanford.edu/software/crf-faq.html#mfiles

下面是NER常见问题解答页面中的摘录

  

如何从多个文件中训练一个模型?

     

而不是设置trainFile属性或标志,而是设置   trainFileList属性或标志。使用逗号分隔的文件列表。