在脱机Solr / Lucene索引上调用commit的频率如何?

时间:2011-04-11 22:56:36

标签: lucene solr solrnet

我知道有一些半类似的问题,但在这种情况下,我正在构建一个脱机的索引,直到构建完成。我正在从头开始构建两个核心,一个有大约300k记录,有很多引用信息和大块全文(这是文档索引)和另一个核心,有大约660万条记录,全文(这是页面索引) )。

鉴于此索引是脱机构建的,唯一真正的性能问题是构建速度。没有人应该查询这些数据。

如果我停止添加项目50秒,自动提交会显然会触发吗?我不这样做。我一次添加十个,每隔几秒就添加一次。

那么,我应该经常承诺吗?我觉得这个运行的时间越长越慢,至少在我的索引6k文档的测试用例中。

没有人搜索这个索引,有人建议我多久提交一次?

应该说我使用的是Solr 3.1和SolrNet。

2 个答案:

答案 0 :(得分:0)

虽然提交需要花费时间,但您可能需要考虑调查其他调整而不是提交频率。

索引核心是否也会进行搜索,或者在索引结束后是否在其他位置复制?如果是后者,那么关闭缓存可能会对性能产生非常明显的影响(solr rebuilds caches every time you commit)。

答案 1 :(得分:0)

您还可以考虑使用Solr的autoCommit或commitWith功能。