问:机器学习模型能否解决基于规则的问题?

时间:2016-02-10 12:17:16

标签: machine-learning nltk word2vec

可以使用机器学习来验证语句或捕获文本文档中的错误吗?

例如,如果你教一个分类器"你应该每天吃两次苹果",但在你正在测试的文件中,声明是"你应该吃苹果每天三次",该声明可以被标记?

显然,您可以构建一些基于规则的软件来捕捉这些,但我的问题在于训练ML模型来捕捉这些,随着规则的变化。

我看过word2vec和NLTK,并用它们进行了一些测试,但不能连接点来教授分类器。

如果可能的话,会怎么做呢或提供一些方向?

谢谢,道格

1 个答案:

答案 0 :(得分:1)

(评论太长了。)

是的,它可以。然而,它非常复杂。例如,这种推理和分析是由沃森完成的。 IBM称之为认知计算。在编写基于规则(或逻辑推理)的系统时,系统可以解决此类任务。因此,您应该问自己的问题是如何从文本中提取所需的事实。 => NLP,词性,命名实体,......然而,任务非常艰难,因为"不超过100次"一天与句子不矛盾。所以推理需要丰富的背景知识。

如上所述,这是一个非常广泛的话题。你必须草拟解决方案,然后挑选一小块,这将被称为博士论文;)。 这个漂亮的图片http://matt.might.net/articles/phd-school-in-pictures/

中说明了这一点

因此,找到正确的博士论文关键词http://nakashole.com/papers/2012-phd-thesis.pdf。这个可能会为你提供几个晚上的阅读。

如果你想尝试使用NLTK,我会为你想要分析的句子生成解析树。之后,您可以尝试对齐这些并检查重叠和偏差。但是,我不确定如何得出结论。一个稍微简单的版本就是逐字逐句地匹配。 Levenstein距离计算的一些东西。