Question

我正在 Solr 中进行拼写检查。我在拼写检查器组件中实施了建议和排序规则。

Most of the time collations work fine but in few case it fails.

工作：

我尝试了query:gone wthh thes wnd：在此 wnd 中没有提供 wind 的建议，但整理即将正确< / strong> = 随风而去，hits = 117

无效：

但是当我尝试query: gone wthh thes wint时： wint 确实提供了风的建议，但是整理未来对。而不是随风而去它会让与西方一起消失，hits = 1

我还想知道排序规则中点击的内容。

配置：

solrconfig.xml: <searchComponent name="spellcheck" class="solr.SpellCheckComponent"> <str name="queryAnalyzerFieldType">textSpellCi</str> <lst name="spellchecker"> <str name="name">default</str> <str name="field">gram_ci</str> <str name="classname">solr.DirectSolrSpellChecker</str> <str name="distanceMeasure">internal</str> <float name="accuracy">0.5</float> <int name="maxEdits">2</int> <int name="minPrefix">0</int> <int name="maxInspections">5</int> <int name="minQueryLength">2</int> <float name="maxQueryFrequency">0.9</float> <str name="comparatorClass">freq</str> </lst> </searchComponent> <requestHandler name="/spell" class="solr.SearchHandler" startup="lazy"> <lst name="defaults"> <str name="df">gram_ci</str> <str name="spellcheck.dictionary">default</str> <str name="spellcheck">on</str> <str name="spellcheck.extendedResults">true</str> <str name="spellcheck.count">25</str> <str name="spellcheck.onlyMorePopular">true</str> <str name="spellcheck.maxResultsForSuggest">100000000</str> <str name="spellcheck.alternativeTermCount">25</str> <str name="spellcheck.collate">true</str> <str name="spellcheck.maxCollations">50</str> <str name="spellcheck.maxCollationTries">50</str> <str name="spellcheck.collateExtendedResults">true</str> </lst> <arr name="last-components"> <str>spellcheck</str> </arr> </requestHandler> Schema.xml: <field name="gram_ci" type="textSpellCi" indexed="true" stored="true" multiValued="false"/> </fieldType><fieldType name="textSpellCi" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.ShingleFilterFactory" maxShingleSize="5" minShingleSize="2" outputUnigrams="true"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.ShingleFilterFactory" maxShingleSize="5" minShingleSize="2" outputUnigrams="true"/> </analyzer> </fieldType>

Answer 1

我得到了我的问题的答案。深度阅读后，我找到了校对背后的逻辑。

1) spellcheck.maxCollations:只需制作整理候选人就可以对索引进行测试。

2) spellcheck.maxCollationTries :它评估 spellcheck.maxCollations 时构建的排序规则。如果我们设置spellcheck.maxCollationTries 低的值，那么它会提供更好的排序规则，而如果我们设置spellcheck.maxCollationTries 高的值，然后它会提供更多的整理结果，但会损害性能。

所以，通过增加 spellcheck.maxCollationTries的值，它会将与wint 一致的整理归结为随风而去但我再说一遍，伤害表现。

排序在Solr中无法正常工作

1 个答案: