我正在为keyword based entity search system
实施DBpedia
。对于算法,我需要正确的候选关键字,例如,如果我有关键字Bill
,我需要http://www.w3.org/2001/XMLSchema#Bill_Gates。目前,我正在使用Lucene
,如果实体有label
或name
,我会将此实体映射到此标签/名称。但是,在这种情况下,它产生了许多非预期的候选人。为了防止它,我正在应用String similarity check
,但它仍然不如它应该成功。因此,寻找使用给定关键字获得正确实体的有效方法。