是否有自动文本摘要的语料库?

时间:2016-02-07 20:18:50

标签: nlp text-mining topic-modeling summarization

我想处理与文字摘要相关的不同任务:

  • 主题/关键字提取
  • 句子提取

有什么英语语料库帮助完成这项任务?

2 个答案:

答案 0 :(得分:2)

查看TAC共享任务:http://www.nist.gov/tac/2011/Summarization/

编辑:您可以回过头来查看之前的TAC / DUC摘要共享任务。另请注意签署某些许可协议所需的部分数据。

答案 1 :(得分:1)

20个新闻组数据集是主题的流行数据集。如果您使用python,则可以使用scikit learn访问它。有关详细信息,请参阅此处:http://scikit-learn.org/stable/datasets/twenty_newsgroups.html