索尔的相关性提升非常缓慢

时间:2013-11-05 23:38:59

标签: performance solr lucene relevance

我有一个Solr索引,里面有大约250万个项目,我正在尝试使用ExternalFileField来提高相关性。不幸的是,当我尝试这样做时,它非常慢,尽管它是一台强大的机器而且Solr有很多可用的内存。

在外部文件中,我有以下内容:

747501=3.8294805903e-07
747500=3.8294805903e-07
1718770=4.03292174724e-07
1534562=3.8294805903e-07
1956010=3.8294805903e-07
747509=3.8294805903e-07
747508=3.8294805903e-07
1718772=3.8294805903e-07
1391385=3.8294805903e-07
2089652=3.8294805903e-07
1948271=3.8294805903e-07
108368=3.84404072186e-06

每一行都是文档ID,它是相应的提升因子。

在我的查询中,我正在使用edismax,我正在使用boost参数,将其设置为pagerank。整个查询is here

在我的架构中,我有:

<!-- External File Field Type-->
<fieldType name="pagerank"
           keyField="id"
           stored="false"
           indexed="true"
           omitNorms="false"
           class="solr.ExternalFileField"
           valType="float"/>

   <field name="pagerank"
          type="pagerank"
          indexed="true"
          stored="true"
          omitNorms="false"/>

但表现很糟糕。我错过了一个设置还是什么?

1 个答案:

答案 0 :(得分:0)

根据the javadoc

  

外部文件可能由键字段排序或未排序,但它   如果没有排序,它将大大减慢(未经测试)。

正如我所见,文件中的ID未分类。你可以对它进行排序并测试它是否有帮助吗?