假设我有很长的文字,我想搜索“Term1 Term2 Term3 Term4”
我想以轻松的方式展示类似的文件 -
其他术语可介于合理的事项之间 - doc可以接受“Term1 OtherTerm Term2 OtherTerm Term3”
不是所有4个词都应该出现 - 再次以合理的方式(3个词可以)
从我的经历看来,SOLR只检索了您正在搜索的Exact(!)文本的文档...
我尝试添加所有具有下限的参数: Raw Query Params:mlt = true& mlt.fl = Text& mlt.boost = true& mlt.mindf = 1& mlt.mintf = 0& mlt.interestingTerms = Text
那么 - 是否可以进行相似性工作而不仅仅是精确搜索?
答案 0 :(得分:1)
mlt参数仅控制此操作的工作方式。 MoreLikeThis工作分为两个阶段,首先它从查询中获取一组结果,然后任何MoreLikeThis功能发挥作用。然后它获取该查询的结果,并查找与它们类似的文档。通常,它通过从文档正文中选择它认为最相关和最有用的搜索项并搜索它们来做到这一点。因此,他们的mlt参数与初始查询的处理方式无关。通常,您希望初始mlt查询获得非常少的结果,通常是单个文档。
听起来你根本不想使用短语查询,所以丢失了引号。
"Term1 Term2 Term3 Term4"
=短语查询,按顺序查找所有这些条款Term1 Term2 Term3 Term4
=一系列单独的术语查询。在该领域的任何地方查找所有或任何条款。有关详细信息,请参阅lucene query parser syntax documentation。