我有一个用于邮政地址搜索的4.4 solr核心,我在阅读this solr name search approach后进行了配置。
现在一切都很好,除了查询时间。我有大约80M的索引地址,我搜索一组800K的场地。当使用PortugueseStemFactory解决此问题的另一种方法时,所有800K搜索将在大约5小时内完成。
这个EdgeNGramFactory方法现在花费了超过24小时,刚刚超过整个文件的10%。它更精确,但批量工作需要很长时间。
我真的需要一些关于如何改善此特定案例的查询时间的建议,甚至是Solr的整体调整和瓶颈调查及故障排除提示。
同样在我的查询中,我使用按strdist和sqedist排序,如果这与此问题有任何关联。
如果您需要更多详细信息,请发表评论。
答案 0 :(得分:0)
通常,可以使用Search optimization优化solr查询搜索性能。
考虑到索引大小的大小,最好shard来提高性能。此外,我已经看到盒子上有足够的物理RAM有助于加快搜索操作。
另外,我建议在你的solr查询中使用debugQuery = true,这样你就可以看到哪个部分/组件花费时间的分解。
strdist是一种激烈的活动,但它实际上取决于搜索结果的响应大小。但我不一定认为这会导致问题。