我正在玩Solr SpellCheck组件,目前我的核心是我的'词典'。在这个核心中有一个巨大的单词列表,其中包含“得分”。
示例文件:
"keyword":"facebook",
"frequency":89504,
单词仅在核心中列出一次,因此当我执行拼写检查时,例如 faceboek
spell?omitHeader=true&wt=xml&json.nl=flat&spellcheck=true&spellcheck.q=faceboek&spellcheck.build=false
它返回 facebook ,其频率为1,因为该字只在我的核心中列出一次。但是,我希望频率将是我的字段频率。
返回示例:
<lst>
<str name="word">facebook</str>
<int name="freq">1</int>
</lst>
所以我的问题是。是否可以将 freq 字段修改为每个文档的频率字段,或者是否有其他解决方案?
感谢您的时间。如果问题不清楚,我会提供更多信息。
答案 0 :(得分:1)
考虑使用您的建议创建单独的核心/集合,然后使用它。
这将允许您使用freq对每个文档(即建议)应用提升,并使用fuzzy search(q=term~
)查找建议(如果它们拼写错误)。
根据用例的不同,the Suggester也很有用,但专用的集合会给你最大的灵活性(即你可以按照自己的方式得分)。