命名实体识别(Ner) - 组织名称数据库

时间:2016-04-01 08:10:46

标签: nlp nltk stanford-nlp opennlp named-entity-recognition

我正在研究我目前的土耳其名为实体认可的毕业项目。当我使用人名和位置时,识别器应该捕获土耳其语单词(有时位置可以是不同的语言,例如塔克西姆/伊斯坦布尔的希尔顿酒店)所有我需要在我的数据集中添加“酒店”,其中包含特定的位置标签,如酒店,餐厅或购物中心。但当它来到组织名称标签。我需要找到一个很好的乐队,产品,公司名称数据集,但是无法弄清楚如何找到或收集这个数据集

在stanford nlp工具中:http://nlp.stanford.edu:8080/ner/process

当我输入Facebook,Nike,Adidas等时,它可以找到它的组织。那么有没有办法让该组织命名为Dataset?

1 个答案:

答案 0 :(得分:3)

如果您对具有这些组织名称的数据资源感兴趣。您可以使用其中一个知识库KB,例如

所有这些组织都有这些组织的名称,您需要付出一些努力才能仅使用其类型来提取组织。例如, YAGO 包含可下载文件,其中包含可能的实体及其类型。您可以对其进行过滤,然后您可以使用hasMeaning数据来获取所有可能的名称。

Yago和BabelNet已被用于NER或命名实体消歧系统AIDA和Babelfy。

AIDA提供了可用实体名称的强大数据集,可用于NER。