如何判断一个句子是否在谈论一个特定的主题?

时间:2011-06-15 18:08:56

标签: php nlp

我有预定义的单词,并且想知道句子主要主题是否与预定义单词有关。

示例:

预定义词: iPhone,Nexus,HTC

句:

我喜欢iPhone的新设计 - 主要主题是iPhone

我在我的Nexus上列入Nirvana。 - 主要科目不是预定义的单词

HTC手机比iPhone好 - 主要话题是HTC

想用PHP或者我可以拥有PHP界面的东西。

3 个答案:

答案 0 :(得分:0)

简短版本:按关键字。

此方法仅适用于一组有限的关键字。

相关问题可能是:Using preg_match to find all words in a list

长版:通过解析语言并让计算机系统理解它。

后者是语言学家所做的事情。他们开发这样的系统,需要数年时间。可能你会发现一些可用的实现,但我不知道任何内存。需要问朋友。

答案 1 :(得分:0)

Alias-i有一个natural language parser for PHP

编辑:this page说Alias-i的解析器是用PHP编写的,但是Alias-i的网站说它是用Java编写的。

答案 2 :(得分:0)

尝试goog heurstic并评估它们。 例子: 1.关键字在句子的开头。 2.文本中只有一个关键字。 3.是否存在像“litenining”这样的连续形式,通常会导致主观/无信息的消息。

根据这些功能编写分类器。我会推荐Mallet。