是否有PHP或JS算法可以过滤掉字符串上的名词?

时间:2016-10-06 13:39:11

标签: javascript php

我正在一个论坛上工作并想过制作一个标签生成器,比如Quora.com,但更简单。所以,首先我“净化”了字符串 - 意味着删除了一些不相关的词,如“for”,“in”......

但我无法弄清楚如何只获取字符串中的名词。例如:在这个帖子的标题中“是否有PHP或JS算法可以过滤掉字符串上的名词?”会给我们:

PHP
JS
algorithm
nouns
string

这或多或少都是好的和准确的。但我也不想使用名词列表,因为我不想浪费一半的时间来写它。如果你知道任何好名词列表,我也会很高兴。谢谢。

1 个答案:

答案 0 :(得分:0)

你需要一个“词汇词典”(维护词汇和词汇之间关系的词典),如Princeton Wordnet。这是一个英语单词语义数据库,可用于查询和比较名词/动词甚至同义词/上位词等内容。

这显然会在您的服务器上运行。您必须在服务器端解析字符串(如果您希望它在客户端上看起来像它,则可以使用Ajax)。没有可行的方法可以在浏览器内存中维护整个英文字典,并通过任何类似性能的搜索来搜索它。