使用Spacy进行NER训练

时间:2019-11-20 20:03:11

标签: python nlp spacy

在空的NER模型上运行火车时,我应该只包含标记的数据(必须至少包含一个实体的数据),还是应该完全不包含任何标签的数据(在这种情况下,教学在某些情况下这些单词没有标签的模型)?

1 个答案:

答案 0 :(得分:0)

如果您查看NER的常用训练数据(您可以在http://nlpprogress.com/english/named_entity_recognition.html上找到链接),则会看到大多数/每个示例至少都有一个实体。

尽管如此,该模型仍可能了解到,在任何给定的示例中大多数实体类型都不会出现。但是您总是可以尝试添加真实否定的例子,看看是否有帮助