在ElasticSearch和Tire中使用缺少过滤器的构面

时间:2013-06-07 14:14:57

标签: ruby-on-rails ruby elasticsearch tire

我正在尝试使用包含缺失过滤器的搜索查询的facet,并且它似乎没有考虑将使用丢失的过滤器过滤掉的记录。

在Rails应用程序中:

@items = Item.search(per_page: 100, page: params[:page], load: true) do |search|
  search.query do |query|
    query.boolean do |boolean|
      boolean.must { |must| must.string params[:q], default_operator: "AND" }
      boolean.must { |must| must.term :project_id, @project.id }
    end
    query.filtered do
      filter :missing , :field =>  :user_id
    end
  end
  search.facet('tags') do
    terms :tag
  end
end

生成请求:

curl -X GET 'http://localhost:9200/items/user_story/item?load=true&size=100&pretty' -d '{
  "query": {
    "bool": {
      "must": [
        {
          "query_string": {
            "query": "*",
            "default_operator": "AND"
          }
        },
        {
          "term": {
            "project_id": {
              "term": 132
            }
          }
        }
      ]
    },
    "filtered": {
      "filter": {
        "and": [
          {
            "missing": {
              "field": "user_id"
            }
          }
        ]
      }
    }
  },
  "facets": {
    "tags": {
      "terms": {
        "field": "tag",
        "size": 10,
        "all_terms": false
      }
    }
  },
  "size": 100
}'

其中有nil个方面。

如果我将丢失的过滤器移到search.filter

@items = Item.search(per_page: 100, page: params[:page], load: true) do |search|
  search.query do |query|
    query.boolean do |boolean|
      boolean.must { |must| must.string params[:q], default_operator: "AND" }
      boolean.must { |must| must.term :project_id, @project.id }
    end
  end
  search.filter(:missing, :field => 'user_id' )
  search.facet('tags') do
    terms :tag
  end
end

......它发出请求:

curl -X GET 'http://localhost:9200/user_stories/user_story/_search?load=true&size=100&pretty' -d '{
  "query": {
    "bool": {
      "must": [
        {
          "query_string": {
            "query": "*",
            "default_operator": "AND"
          }
        },
        {
          "term": {
            "project_id": {
              "term": 132
            }
          }
        }
      ]
    }
  },
  "facets": {
    "tags": {
      "terms": {
        "field": "tag",
        "size": 10,
        "all_terms": false
      }
    }
  },
  "filter": {
    "missing": {
      "field": "user_id"
    }
  },
  "size": 100
}'

确实得到了方面但他们没有考虑过滤后的记录。

我是否应该采用另一种方式编写查询,以便我可以获得同时考虑丢失过滤器的方面?

1 个答案:

答案 0 :(得分:1)

如果我理解正确的话,你就会遇到这样的问题:从查询限制的结果计算方面,而不是由顶级filter元素计算。此外,第一个查询对我来说不合适。

我会像这样重写请求:

require 'tire'

params = {:q => 'foo'}

s = Tire.search do |search|
  search.query do |search_query|
    search_query.filtered do |f|

      # Queries
      f.query do |q|
        q.string params[:q], default_operator: "AND"
      end

      # Filters
      f.filter :missing , :field => :user_id
      f.filter :term,     :project_id => '123'
    end
  end
  search.facet('tags') do
    terms :tag
  end
end

puts s.to_curl

基本上,我们使用filtered查询作为主查询,摆脱布尔查询,并使用filter获得最大效率(缺失和术语)。

当然,如果您需要执行更多查询,可以使用q.boolean代替q.string

最后,string查询(即Lucene查询字符串查询)通常是常规搜索的次优选择,因为它向用户表示整个“特殊Lucene语法”,并且容易出错。 match查询通常是更好的选择。