用于命名实体提取的dbpedia NLP数据集

时间:2014-12-02 11:34:04

标签: nlp dbpedia spotlight-dbpedia

我浏览了他们的github文件以及官方网站,我无法找到他们在splotlight中使用的命名实体标记培训语料库。

如何找到数据集而不是经过训练的模型?

1 个答案:

答案 0 :(得分:0)

请参阅此链接https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Web-service

在这里,解释了脱机设置dbpedia查找的方法。他们还提供了4个tar文件

  • redirects_en.nt
  • short_abstracts_en.nt
  • instance_types_en.nt
  • article_categories_en.nt

这些应该是为它训练数据。