在空的NER模型上运行火车时,我应该只包含标记的数据(必须至少包含一个实体的数据),还是应该完全不包含任何标签的数据(在这种情况下,教学在某些情况下这些单词没有标签的模型)?
答案 0 :(得分:0)
如果您查看NER的常用训练数据(您可以在http://nlpprogress.com/english/named_entity_recognition.html上找到链接),则会看到大多数/每个示例至少都有一个实体。
尽管如此,该模型仍可能了解到,在任何给定的示例中大多数实体类型都不会出现。但是您总是可以尝试添加真实否定的例子,看看是否有帮助