Lucene,对场不匹配的负面推动

时间:2016-02-04 13:52:40

标签: lucene

我正在考虑Lucene是否是完成任务的好工具。

我的数据包含公司名称,唯一识别号码(即TAX_ID,统计报告ID号等)。

是否可以创建索引并以允许" down boost"记录与此唯一标识符字段不匹配。

    如果TAX_ID在文档和查询之间匹配,
  • 分数会上升,
  • 如果文档或查询中没有TAX_ID,它将保持中立状态
  • 但如果TAX_ID在文档和查询之间不同,则得分会下降。

1 个答案:

答案 0 :(得分:0)

我这样做的方法是,当文档没有税号时,在TAX_ID中索引特定的标志值,然后使用boost来提供你想要的得分。所以,你的查询看起来像是:

TAX_ID:1234 TAX_ID:NOTAXID^0.5