stanford-nlp - 如何提高StanfordCoreNLP的ner的准确性？

我使用了StanfordCoreNLP的NER来识别实体，包括组织，位置和人。但是存在一些奇怪的东西。例如，我输入了一个像＆＃34;克利夫兰骑士＆＃34;它将承认克利夫兰＆＃39;克利夫兰＆＃39;作为＆＃39; location＆＃39;但不是克利夫兰骑士＆＃39;作为组织。我不是很熟悉，我也不知道NER是如何工作的。我的任务是在文本中获取所有公司名称，我得到的结果不是很令人满意。因此，有两种方法可以解决问题。第一种是修改dict并插入正确的数据。第二是训练模型。但仍有一些问题。

第一种方式是否有效？
如果问题1的答案是肯定的，如何修改字典？

此外，https://nlp.stanford.edu/software/crf-faq.shtml#a上的常见问题列表提出了培训ner模型的方法，但最让我困惑的是如果我训练模型，我会得到什么。

如果我创建一个包含类似
的数据集
＆＃34;组织＆＃39;克利夫兰骑士＆＃39;＆＃34;

训练模型，模型会发生什么？ CRFC分类器内的字典会改变吗？
当我输入“克利夫兰骑士队”时，CRFClassifier会修改错误吗？并认可克利夫兰骑士队＆＃39;作为一个组织实体？

如何提高StanfordCoreNLP的ner的准确性？

1 个答案: