新闻文章和标题的自由文本挖掘语料库

时间:2017-06-14 08:54:55

标签: text-mining

是否有基于新闻文章和标题的免费语料库?

我正在寻找可以进行文本挖掘和分析的领域,我需要一组相关数据。

我可以在哪里免费下载?

1 个答案:

答案 0 :(得分:1)

正如已经提到的,这类问题对于SO而言是偏离主题的,但由于我知道您可能感兴趣的一个好的数据集,我正在分享这些信息。

<强> Newyork Times 2013 (NYT2013)

  • 纽约时报,CNN和BBC新闻文章以及2014年发生的四起重大事件的用户评论。
  • 2013年纽约时报新闻文章和用户评论。

在工作中使用 - Socially-Informed Timeline Generation for Complex Events。数据集可以从here下载。