如何在顶级GraphDB Lucene索引上计算Lucene FuzzyQuery?

时间:2019-05-18 12:42:21

标签: lucene graphdb

GraphDB支持FTS Lucene插件来构建RDF'分子'以有效地索引文本。但是,当您搜索的单词中有错字(missspell)时,Lucene将不会检索结果。我想知道是否有可能在GraphDB for FTS中的Lucene索引之上基于Damerau-Levenshtein算法实现FuzzyQuery。这样,即使单词拼写不正确,您也可以基于编辑距离相似度获得更多“封闭”单词的列表。

这是我为WordNet RDF中的NounSynset标签建立索引的索引。

X

运行查询时

PREFIX wn20schema: <http://www.w3.org/2006/03/wn/wn20/schema/>
INSERT DATA {
    luc:index luc:setParam "uris" .
    luc:include luc:setParam "literals" .
    luc:moleculeSize luc:setParam "1" .
    luc:includePredicates luc:setParam "http://www.w3.org/2000/01/rdf-schema#label" .
    luc:includeEntities luc:setParam wn20schema:NounSynset.
    luc:nounIndex luc:createIndex "true".
}

结果为空,并且我想至少获得“ credit”一词,因为编辑距离为1。

谢谢!

1 个答案:

答案 0 :(得分:0)

如果您使用~,它将为您提供模糊匹配。