Solr wordbreak拼写检查器将单词分解为字母 - 过度破坏

时间:2014-05-24 21:17:36

标签: solr spell-checking solr4

我正在使用Solr wordbreak spellchecker,问题在于当我搜索像“mob ile”这样的术语时,期望wordbreak spellchecker实际上会重新提出“移动”的建议,它会将搜索词分成像“mob”这样的字母这个行为我有两个问题。

  1. 如何让Solr将“mob ile”与手机结合起来?
  2. 尽管我的搜索词“mob ile”被错误地分解成单个字母这一事实,我意识到在某些情况下需要使用wordbreak,我如何控制wordbreak以便它不会将其分解为像“暴徒”对我来说似乎过分了?
  3. 感谢。

1 个答案:

答案 0 :(得分:1)

将参数minBreakLength添加到wordbreak拼写检查组件可以解决创建过小字符串的问题:

   <!-- a spellchecker that can break or combine words.  See "/spell" handler below for usage -->
<lst name="spellchecker">
  <str name="name">wordbreak</str>
  <str name="classname">solr.WordBreakSolrSpellChecker</str>      
  <str name="field">my_wb_field</str>
  <str name="combineWords">true</str>
  <str name="breakWords">true</str>
  <int name="maxChanges">3</int>
  **<int name="minBreakLength">3</int>**
</lst>