如何使用深度学习预测新闻文章的标题?

时间:2016-06-04 08:41:41

标签: deep-learning text-mining recurrent-neural-network

我对深度学习感兴趣。 最近,我使用新闻文章数据集研究了文本挖掘。

我想从一篇文章中提取重要的一两句话。 所以,我将此问题模仿为近似版本,即找到文章标题。

培训示例如下: x是文章正文的集合,和 y是文章标题的集合。

但是,测试示例只有x。 (没有y) 在训练模型之后,我预测测试集的标题,仅使用其身体。

如何构建模型? 作为深度学习的初学者,我想对这个问题有一些见解或暗示。

谢谢!

1 个答案:

答案 0 :(得分:0)

我认为你可以调整image captioning的架构,它使用CNN进行输入分析,为语言生成提供RNN。

对于您的标题生成应用程序,请将其视为文档字幕而不是图像字幕,并在文档文本和标题文本上的RNN上训练Recurrent CNN

对于初学者来说,这是非常雄心勃勃的,所以我建议你开始"更简单"使用CNNRNN的现成例子来理解深度学习的组成部分和基本概念。