哪里可以获得新闻摘要语料库?

时间:2013-08-29 04:35:33

标签: nlp text-mining

是否有可用于自动摘要的公开新闻+摘要语料库。如果是的话,请你提供方法来获取它吗?

2 个答案:

答案 0 :(得分:2)

在这里你也可以免费获得Priberam Compressive Summarization Corpus,它是葡萄牙语:

http://labs.priberam.com/Resources/PCSC.aspx

  

该语料库包含801个文档,分为80个主题,每个主题有10个文档(一个有11个)。这些文件是来自葡萄牙主要报纸,广播电台和电视台的新闻报道。每个主题还有两个人工生成的摘要,最多100个单词。人类摘要是压缩性的:注释器只执行句子和单词删除操作。

答案 1 :(得分:0)

可以在Sourceforge下载Open Text Summarizer。有关更多提示,请参阅this问题的答案。