GraphDB支持FTS Lucene插件来构建RDF'分子'以有效地索引文本。但是,当您搜索的单词中有错字(missspell)时,Lucene将不会检索结果。我想知道是否有可能在GraphDB for FTS中的Lucene索引之上基于Damerau-Levenshtein算法实现FuzzyQuery。这样,即使单词拼写不正确,您也可以基于编辑距离相似度获得更多“封闭”单词的列表。
这是我为WordNet RDF中的NounSynset标签建立索引的索引。
X
运行查询时
PREFIX wn20schema: <http://www.w3.org/2006/03/wn/wn20/schema/>
INSERT DATA {
luc:index luc:setParam "uris" .
luc:include luc:setParam "literals" .
luc:moleculeSize luc:setParam "1" .
luc:includePredicates luc:setParam "http://www.w3.org/2000/01/rdf-schema#label" .
luc:includeEntities luc:setParam wn20schema:NounSynset.
luc:nounIndex luc:createIndex "true".
}
结果为空,并且我想至少获得“ credit”一词,因为编辑距离为1。
谢谢!
答案 0 :(得分:0)
如果您使用~
,它将为您提供模糊匹配。