我希望能够在lucene查询中找到术语的计数。例如,我有两个字段,一个是位置,另一个是类别。如果我运行查询以获取“洛杉矶,CA”中的所有文档,那么我希望能够快速查看这些文档的类别。我知道solr做了这个与刻面有关的事情,但我希望用朴素的Lucene做到这一点。现在我循环遍历所有文档ID,然后使用哈希表计算条件,但它非常慢。
获得一个termenum但限制我的查询的方法将是理想的。
答案 0 :(得分:1)
现在我正在为我们正在使用的框架开发类似的东西。
我收集了一些描述问题和解决方案的资源: http://code.google.com/p/gtxcontentconnector/issues/detail?id=41