Solr Meter性能测试

时间:2014-02-04 20:35:32

标签: solr performance-testing

我试图找到搜索应用程序的过滤器缓存的最佳设置。我在Boston College library内搜索了~1,500万条MARC记录。我正在测试的应用程序可以是found here。我想调查过滤器缓存设置对内存使用情况的影响(以及filterCache应该设置的内容)。

首先,这似乎是Solr的常用设置。

<filterCache
  class="solr.LRUCache"
  size="16384"
  initialSize="4096"
  autowarmCount="4096"/>

我正试图为Solr Meter设置好的查询。由于每个查询都需要不同,因此我需要假设一个非常长的查询列表,以及一个过滤器查询文本文件。

过滤查询文本文件:

format:Book
format:Electronic
format:Microfilm
~100 more filters 

从solr日志中我还看到如下打印的明显过滤查询:

fq=geographic_facet:"Great+Britain" 
  1. 因此,我假设geographic_facet是一个过滤器而不是一个方面?

  2. 对于查询过滤器文本文件,我需要双引号吗?

  3. 我应该设置哪些其他参数来彻底对solr服务器进行压力测试(以及filterCache设置如何影响内存使用和一般性能)?我假设Solr Meter将是唯一需要的应用程序。谢谢。

1 个答案:

答案 0 :(得分:0)

  1. geographic_facet是一个过滤器。由于你有fq = ...,这是一个过滤器。字段名称并不重要。
  2. 双引号表示它是标准查询解析器中的精确短语查询。话虽如此,确切的行为将取决于对该字段所做的架构和分析。使用Analysis UI页面https://cwiki.apache.org/confluence/display/solr/Analysis+Screen(在solr Admin应用程序中)检查环境中的确切行为。
  3. 在进行压力测试时,通常除了solrmeter之外,我们还应该通过JMX或其他UNIX工具(如(vmstat))获得硬件指标(CPU,内存)。