我有预定义的单词,并且想知道句子主要主题是否与预定义单词有关。
示例:
预定义词: iPhone,Nexus,HTC
句:
我喜欢iPhone的新设计 - 主要主题是iPhone
我在我的Nexus上列入Nirvana。 - 主要科目不是预定义的单词
HTC手机比iPhone好 - 主要话题是HTC
想用PHP或者我可以拥有PHP界面的东西。
答案 0 :(得分:0)
简短版本:按关键字。
此方法仅适用于一组有限的关键字。
相关问题可能是:Using preg_match to find all words in a list
长版:通过解析语言并让计算机系统理解它。
后者是语言学家所做的事情。他们开发这样的系统,需要数年时间。可能你会发现一些可用的实现,但我不知道任何内存。需要问朋友。
答案 1 :(得分:0)
Alias-i有一个natural language parser for PHP。
编辑:this page说Alias-i的解析器是用PHP编写的,但是Alias-i的网站说它是用Java编写的。
答案 2 :(得分:0)
尝试goog heurstic并评估它们。 例子: 1.关键字在句子的开头。 2.文本中只有一个关键字。 3.是否存在像“litenining”这样的连续形式,通常会导致主观/无信息的消息。
根据这些功能编写分类器。我会推荐Mallet。