我将开始研究用于文本生成的神经网络。输入内容将是用户的一些话(例如,明天英国脱欧公投的可能性将保持在欧盟范围内),输出结果将是一个很好的,写得很好的句子(例如英国脱欧公投将在明天进行,英国不太可能留在欧盟欧洲联盟)。
对于实现,我正在考虑一个sequence2sequence模型,但是在开始编写代码之前,我想检查一下之前是否涉及过该主题。在Google进行了许多搜索之后,似乎以前没有人做过类似的项目(尽管有关文本翻译的论文很多),这让我感到惊讶,因为这种工具对许多人(例如记者等)有用。
你们中的任何人在某处看到过一些有用的Python代码或相关文章吗?
答案 0 :(得分:1)
Sequence2Sequence是我想到的。正如您通过Google发现的那样,使用RNN / LSTM的文本生成代码只会创建语法正确但无意义的句子。
您是否有大量的示例库来训练seq2seq模型?翻译模型需要非常大的语料库。创建这样的语料库的一个选择是收集新闻的标题和第一段。将标题作为原始语言,将文章的第一段/句子作为翻译语言。
这是blog,有关使用第二个模型使用Doc2Vec过滤从seq2seq生成的句子