应用错误收集

时间：2016-06-04 08:41:41

标签： deep-learning text-mining recurrent-neural-network

我对深度学习感兴趣。最近，我使用新闻文章数据集研究了文本挖掘。

我想从一篇文章中提取重要的一两句话。所以，我将此问题模仿为近似版本，即找到文章标题。

培训示例如下： x是文章正文的集合，和 y是文章标题的集合。

但是，测试示例只有x。（没有y）在训练模型之后，我预测测试集的标题，仅使用其身体。

如何构建模型？作为深度学习的初学者，我想对这个问题有一些见解或暗示。

谢谢！

答案 0 :(得分：0)

我认为你可以调整image captioning的架构，它使用CNN进行输入分析，为语言生成提供RNN。

对于您的标题生成应用程序，请将其视为文档字幕而不是图像字幕，并在文档文本和标题文本上的RNN上训练Recurrent CNN。

对于初学者来说，这是非常雄心勃勃的，所以我建议你开始＆＃34;更简单＆＃34;使用CNN和RNN的现成例子来理解深度学习的组成部分和基本概念。