训练文本模型以预测真假

时间:2017-07-06 11:36:02

标签: machine-learning nlp keras caffe

所以我是整个机器学习主题的新手,但我认为我有一个有趣的问题需要解决。我基本上只是想知道一个句子是否符合 TRUE FALSE

这里有一些例句:

  • 是的,这是我 - > TRUE
  • 这是我 - > TRUE
  • 是的 - > TRUE
  • 这不是我 - > FALSE

...

现在我需要一些提示,以便我能够成功地训练模型,例如Keras,Caffe或其他工具以及我应该遵循的主要原则。

感谢任何提示

更新

所以根据我的理解,我需要做自然语言分类。我需要创建2个类并获得每个类的概率。

https://github.com/Russell91/nlpcaffe这样的东西会有用吗?

1 个答案:

答案 0 :(得分:0)

如果我的理解是正确的,您希望将各种回复归类为true / false,这些回复可能是对话中的问题回答。

对于这种情况,您应该创建/拥有包含truefalse类的大量示例的数据集,并训练二进制文本分类器。您可以阅读SVM和Naive Bayes,它们非常适合文本分类,并且可以使用Scikit-Learn轻松实现。