Solr承诺花了太长时间

时间:2011-06-07 11:04:01

标签: lucene solr

如果您从Dataimport注意到,我的提交似乎花费了太多时间 下面给出的状态是提交1000个文档,花费时间超过24分钟

<str name="status">busy</str>
<str name="importResponse">A command is still running...</str>
<lst name="statusMessages">
<str name="Time Elapsed">0:24:43.156</str>
<str name="Total Requests made to DataSource">1001</str>
<str name="Total Rows Fetched">1658</str>
<str name="Total Documents Skipped">0</str>
<str name="Full Dump Started">2011-06-07 09:15:17</str>
<str name="">
Indexing completed. Added/Updated: 1000 documents. Deleted 0 documents.
</str>
</lst>

可能导致这种情况的原因,我一直试图寻找改进的理由或方法 这个,但我无法找到。按照这个速度,我的文件永远不会得到 索引,因为我有超过100,000条记录进入数据库 每小时。

此致 罗希特夏尔

2 个答案:

答案 0 :(得分:1)

我不知道你是否使用solrj

public abstract class SolrServer

但如果你这样做,你真的需要按照chuncks / collections进行索引:

  public UpdateResponse add(Collection<SolrInputDocument> docs ) 

而不是一个一个

答案 1 :(得分:0)

在数据导入处理程序中添加了optimize = false。这使得事情在某种程度上变得更快,现在我只在非高峰时段进行优化。