我对深度学习感兴趣。 最近,我使用新闻文章数据集研究了文本挖掘。
我想从一篇文章中提取重要的一两句话。 所以,我将此问题模仿为近似版本,即找到文章标题。
培训示例如下: x是文章正文的集合,和 y是文章标题的集合。
但是,测试示例只有x。 (没有y) 在训练模型之后,我预测测试集的标题,仅使用其身体。
如何构建模型? 作为深度学习的初学者,我想对这个问题有一些见解或暗示。
谢谢!
答案 0 :(得分:0)
我认为你可以调整image captioning的架构,它使用CNN进行输入分析,为语言生成提供RNN。
对于您的标题生成应用程序,请将其视为文档字幕而不是图像字幕,并在文档文本和标题文本上的RNN上训练Recurrent CNN。
对于初学者来说,这是非常雄心勃勃的,所以我建议你开始"更简单"使用CNN和RNN的现成例子来理解深度学习的组成部分和基本概念。