我正在使用Solr搜索一长串ID,如下所示:
ID:("4d0dbdd9-d6e1-b3a4-490a-6a9d98e276be"
"4954d037-f2ee-8c54-c14e-fa705af9a316"
"0795e3d5-1676-a3d4-2103-45ce37a4fb2c"
"3e4c790f-5924-37b4-9d41-bca2781892ec"
"ae30e57e-1012-d354-15fb-5f77834f23a9"
"7bdf6790-de0c-ae04-3539-4cce5c3fa1ff"
"b350840f-6e53-9da4-f5c2-dc5029fa4b64"
"fd01eb56-bc4c-a444-89aa-dc92fdfd3242"
"4afb2c66-cec9-8b84-8988-dc52964795c2"
"73882c65-1c5b-b3c4-0ded-cf561be07021"
"5712422c-12f8-ece4-0510-8f9d25055dd9"...etc
这可以达到一定程度,但超过一定的大小会失败并显示以下消息:布尔子句太多。您可以在solrconfig.xml中增加限制,但这只会到目前为止 - 我希望限制是有原因的:
<maxBooleanClauses>1024</maxBooleanClauses>
我可以将查询拆分成几个小的,但这会阻止我对结果进行排序。必须有更合适的方法吗?
答案 0 :(得分:6)
您应该使用Lucene过滤器而不是构建庞大的布尔查询。尝试使用FieldCacheTermsFilter并将该过滤器传递给您的搜索者。 FieldCacheTermsFilter会将您的UID转换为Lucene DocIdSet,它会快速执行,因为它是通过FieldCache进行的。