搜索词识别

时间:2014-03-07 06:06:19

标签: ruby-on-rails ruby search web

我正在尝试为我的搜索做一个小型分析插件。我想从所有搜索中分离出有用的搜索词。

例如:

  

搜索:“我在哪里注册魅力类”

     

搜索字词:“register”,“charms class”

我知道如果程序没有我们整个数据的上下文,这是不可能的。但是有什么东西可以用来实现部分结果吗?

3 个答案:

答案 0 :(得分:0)

你可以做的是将字符串分解为字符串数组

keywords = "where do i register for charms class".split(" ")
#=> ["where", "do", "i", "register", "for", "charms", "class"]

然后你可以遍历关键字数组。这不是一个完美的解决方案,但它仍然可以帮助你。

答案 1 :(得分:0)

我对此的看法是制定消除无用词语的规则 就像删除文章,动词,代词和其他无用的东西一样 您可以先对字符串进行标记,然后执行修剪 在此之后,您可以创建规则以进一步提取重要的令牌。

供参考:

Tokenizer

Tokenizing a String

答案 2 :(得分:0)

您可以将所有关键字放入数组中:

keywords = ['some keyword', 'another keyword']

string = 'My string with some keyword'

keywords.none?{|keyword| string.include?(keyword)} #=> true/false