......或性别信息是否足够? 更具体地说,我有兴趣知道我是否可以减少斯坦福Core NLP加载的模型数量来提取核心参考。我对实际的命名实体识别不感兴趣。
谢谢
答案 0 :(得分:5)
根据描述与Stanford CoreNLP一起打包的coref系统的EMNLP论文,命名实体标签仅用于以下coref注释传递:精确构造,轻松头部匹配,和代词 (Raghunathan et al. 2010)。
您可以使用 dcoref.sievePasses 配置属性指定要使用的传递。如果你想要共参考但你不想做NER,你应该能够在没有NER的情况下运行管道,并指定coref系统应该只使用不需要NER标签的注释传递。
但是,生成的coref注释会在recall上受到影响。因此,您可能需要进行一些实验来确定注释的降级质量是否存在问题,无论您将它们用于下游。
答案 1 :(得分:1)
总的来说,是的。首先,您需要命名实体,因为它们充当候选antecedents或代词所指的目标。许多(大多数?)系统在一个步骤中执行实体识别和类型分类。其次,实体的语义类别(例如人,组织,位置)对于构建准确的共同链很重要。