创建智能文本生成器

时间:2010-05-28 02:42:27

标签: text artificial-intelligence generator markov-chains

我这样做是为了好玩(或者4chan说“为了lh lzz”)并且如果我在途中学到了更好的东西。我差不多2年前参加了一个人工智能课程,我非常喜欢它,但我设法忘记了一切,所以这是一种刷新它的方法。

无论如何,我希望能够在给定一组输入的情况下生成文本。基本上,这将阅读论坛输入(或可能是Twitter推文),然后根据学习生成评论。

现在最简单的方法是使用Markov Chain Text Generator,但我想要比这更复杂的东西,因为MKC基本上只通过单词顺序学习(哪个单词更可能出现在单词x之后给出输入文本)。我试图看看我能做些什么来让它变得更聪明一些。

例如,我希望它能做到这样的事情:

  • 从留言板中的大量帖子中学习,但不要过多加权
  • 每篇文章:
    • 从该帖子中的其他评论中学习,并将这些输入加权
    • 生成评论并发布
    • 了解其他用户对您帖子的反应。如果好的话可以衡量它,那么你会发布更多与制作的帖子类似的帖子,反之亦然。

从错误的角度来衡量和学习,我不确定如何实施。我想过Artificial Neural Networks(主要是因为我记得很喜欢那一章)但据我所知,它主要用于对事物进行分类(即给出一组有限的选择[x1 ... xn],其中x是给定的输入)没有真正生成任何东西。

我甚至不确定这是否可能,或者我应该怎么做才能学习/搞清楚。什么算法最适合这个?

对于那些担心我会将其用作机器人垃圾邮件或提供错误答案的人,我保证我不会用它来提供(坏)建议或垃圾邮件以获取利润。我绝对不会发布它对SO的荒谬想法。我打算用它来娱乐。

谢谢!

1 个答案:

答案 0 :(得分:2)

我也在考虑这样的事情。我认为将语法分析器与马尔可夫链发生器一起使用可能会带来显着的改进。然后MC可以训练文本短语(动词“驱动”经常与对象“汽车”)并产生语法正确的句子。