我想从文本中识别人的名字。但是我感到困惑,我必须为NER使用哪个NLP库。我发现了针对NER的最佳NLP库 1.斯坦福大学核心自然语言处理 2.空间 3. Google云。
我无法找出哪个库会给出更准确的结果和更好的性能。请在这里帮助我。
答案 0 :(得分:3)
spaCy在NLP方面具有行业优势,而在NER方面则明显更快,更准确。它还与多语言模型捆绑在一起。选中spaCy
AllenNLP还配备了最新的NER模型,但使用起来有些复杂。选中AllenNLP demo
如果不是问题所在,那么我建议使用Google的Cloud Natural Language(当然,它更快更准确)。
我个人使用过spaCy和AllenNLP。我想说的是,如果您只是想开始使用spaCy。
希望这会有所帮助。
答案 1 :(得分:1)
您的问题是询问哪个库将提供最准确的结果,而又不需要太多的计算能力。自然语言处理(NLP)领域正在迅速变化。为了说明这一点,我们可以看看命名实体识别(NER)的最新技术(SOTA)。 This Github页面为CONLL03 NER数据集提供了不错的摘要,由于易于记忆,我将在此处复制并使用公司名称:
基于此列表,我们观察到每隔几个月就会获得新的SOTA。因此,“最准确的系统(库)”也必须每几个月更新一次。数据的性能不仅取决于系统,还取决于以下内容:
TL; DR :只需选择一个对您来说易于实施且具有合理准确性的系统。基于准确性选择系统并非易事,并且需要经常切换系统。