Apache Solr更像这样:mlt.minwl参数如何影响查询结果

时间:2011-03-11 21:53:23

标签: php drupal search solr

Apache Solr wiki表示mlt.minwl = 最小字长,低于哪个字将被忽略。

赞赏这个具体的例子。

示例查询(已解码)

(字符串:822)QT = MLT&安培; FL = NID%2Ctitle%2Cpath%2Curl%2Css_simple_geo_position%2Cis_cck_field_sponsored_content_yn%2Cis_cck_field_compound_review_yn%2Cis_workflow_state%2Cds_cck_field_publish_date%2Cds_cck_field_publish_expiration_date%2Csm_timeout_search_event_type%2Csm_timeout_search_event_genre%2Csm_timeout_search_venue_type%2Csm_timeout_search_venue_feature%2Csm_timeout_search_venue_genre&安培; mlt.fl =身体% 2Cname%2Ctaxonomy_names%2Ctitle&安培; mlt.mintf = 1&安培; mlt.mindf = 1&安培; mlt.minwl = 3及mlt.maxwl = 15&安培; mlt.maxqt = 20&安培; FQ%5B0%5D = -is_cck_field_exclude_from_search%3A1&安培; FQ%5B1 %5D = -type%3Aimage&安培; FQ%5B2%5D = -type%3Aoccurrence&安培; FQ%5B3%5D =%28nodeaccess_f98a254002c9_all%3A0 + OR + nodeaccess_f98a254002c9_workflow_access%3A1 + OR + nodeaccess_f98a254002c9_workflow_access_owner%3A0 + OR + nodeaccess_all%3A0%29&安培; facet.limit = 21&安培;版本= 1.2&安培;重量= JSON&安培; json.nl =映射&安培; q =牛奶&安培;开始= 0&安培;行= 4

1 个答案:

答案 0 :(得分:2)

如果由MLT找到的“有趣的术语”(相似),其字符数少于mlt.minwl,则会被忽略(从MLT结果中排除)。
该参数的默认值为0,这意味着该参数无效。

  

内部运作的本质   MLT的运作方式如下:

     
      
  1. 使用输入中的频率信息收集所有条款   文件:
  2.   
  3. 如果输入文档是对文档内的文档的引用   索引,然后遍历字段   在mlt.fl中列出,然后是术语   所需的信息很容易   如果该领域有   termVectors已启用。否则得到   存储的文本,并重新分析它   推导出这些术语。如果输入   文档作为文本发布到   处理程序,然后分析它来派生   条款。使用的分析是   为列出的第一个字段配置   在mlt.fl。
  4.   
  5. 根据配置的阈值过滤“有趣的术语”,其中一个是你的mlt.minwl param
  6.   
  7. 构建一个包含所有这些有趣术语的查询   mlt.fl。中列出的字段。
  8.