Solr SpellCheck组件自定义频率字段?

时间:2018-05-25 12:28:23

标签: solr

我正在玩Solr SpellCheck组件,目前我的核心是我的'词典'。在这个核心中有一个巨大的单词列表,其中包含“得分”。

示例文件:

    "keyword":"facebook",
    "frequency":89504,

单词仅在核心中列出一次,因此当我执行拼写检查时,例如 faceboek

spell?omitHeader=true&wt=xml&json.nl=flat&spellcheck=true&spellcheck.q=faceboek&spellcheck.build=false

它返回 facebook ,其频率为1,因为该字只在我的核心中列出一次。但是,我希望频率将是我的字段频率

返回示例:

<lst>
  <str name="word">facebook</str>
  <int name="freq">1</int>
</lst>

所以我的问题是。是否可以将 freq 字段修改为每个文档的频率字段,或者是否有其他解决方案?

感谢您的时间。如果问题不清楚,我会提供更多信息。

1 个答案:

答案 0 :(得分:1)

考虑使用您的建议创建单独的核心/集合,然后使用它。

这将允许您使用freq对每个文档(即建议)应用提升,并使用fuzzy searchq=term~)查找建议(如果它们拼写错误)。

根据用例的不同,the Suggester也很有用,但专用的集合会给你最大的灵活性(即你可以按照自己的方式得分)。