如何检索Lucene中“击中”的字段

时间:2013-03-02 21:14:15

标签: java lucene

也许我真的错过了什么。

我已经在Lucene中索引了一堆键/值对(v4.1,如果重要的话)。说我有 key1 = value1和key2 = value2,例如从属性文件中读取。

它们既被作为特定字段索引,又被索引到一个笼统的“ALL”字段,例如

new Field("key1", "value1", aFieldTypeMimickingKeywords);
new Field("key2", "value2", aFieldTypeMimickingKeywords);
new Field("ALL", "key1=value1", aFieldTypeMimickingKeywords);
new Field("ALL", "key2=value2", aFieldTypeMimickingKeywords);
// then get added to the Document of course...

然后我可以使用

进行通配符搜索
new WildcardQuery(new Term("ALL", "*alue1"));

它会找到命中。

但是,获得更多信息会更好,例如“什么是完整的价值(例如”key1 = value1“)与该命中一起?”。

最好我可以弄清楚它来获取Document,然后获取IndexableFields列表,然后循环遍历所有这些并查看field.stringValue()。contains(“alue1”)。 (我可以查看调试器中的数据结构,所有信息都在那里)

这似乎是完全疯狂的原因不是 Lucene刚刚做了什么?命中信息不应该返回一些字段吗?

Lucene是否错过了看似“明显”的功能?谷歌和从API开始并没有透露任何直截了当的内容,但我觉得我一定在寻找错误的东西。

1 个答案:

答案 0 :(得分:5)

您可能想尝试使用IndexSearcher.explain()方法。获得匹配文档的ID后,为每个字段准备一个查询(使用相同的搜索关键字)并为每个查询调用Explanation.isMatch():产生true的那些将为您提供匹配的字段。例如:

for (String field: fields){
    Query query = new WildcardQuery(new Term(field, "*alue1"));
    Explanation ex = searcher.explain(query, docID);
    if (ex.isMatch()){
        //Your query matched field
    }
}