如果您从Dataimport注意到,我的提交似乎花费了太多时间 下面给出的状态是提交1000个文档,花费时间超过24分钟
<str name="status">busy</str>
<str name="importResponse">A command is still running...</str>
<lst name="statusMessages">
<str name="Time Elapsed">0:24:43.156</str>
<str name="Total Requests made to DataSource">1001</str>
<str name="Total Rows Fetched">1658</str>
<str name="Total Documents Skipped">0</str>
<str name="Full Dump Started">2011-06-07 09:15:17</str>
<str name="">
Indexing completed. Added/Updated: 1000 documents. Deleted 0 documents.
</str>
</lst>
可能导致这种情况的原因,我一直试图寻找改进的理由或方法 这个,但我无法找到。按照这个速度,我的文件永远不会得到 索引,因为我有超过100,000条记录进入数据库 每小时。
此致 罗希特夏尔
答案 0 :(得分:1)
我不知道你是否使用solrj
public abstract class SolrServer
但如果你这样做,你真的需要按照chuncks / collections进行索引:
public UpdateResponse add(Collection<SolrInputDocument> docs )
而不是一个一个
答案 1 :(得分:0)
在数据导入处理程序中添加了optimize = false。这使得事情在某种程度上变得更快,现在我只在非高峰时段进行优化。