Azure搜索 - 使用Microsoft English Analyzer增加了索引的大小

时间:2017-03-27 13:03:15

标签: azure azure-search

之前我的索引是使用lucene分析仪。我把它改成了微软。现在指数的规模已大幅增加。为什么尺寸增加如此之多。 ?附:附件。 enter image description here

1 个答案:

答案 0 :(得分:2)

预计索引大小会有所不同。对于文档中的每个单词,Microsoft分析器会生成原始单词和该单词的基本形式,例如,如果您的文档中包含单词 ,则Azure搜索将索引两个术语:正在运行运行。有关详细信息,请参阅以下帖子中的我的回答:Azure Search: Searching for singular version of a word, but still include plural version in results

Lucene分析器干预了导致索引中唯一项不足的原因。 您可以在此处详细了解差异:https://docs.microsoft.com/en-us/rest/api/searchservice/Language-support?redirectedfrom=MSDN

根据分析器/语言,对索引大小的影响会有所不同。您可以使用Analyze API测试您正在使用的分析仪的行为:https://docs.microsoft.com/en-us/rest/api/searchservice/test-analyzer

话虽如此,你所看到的差异超出了我的预期。请通过microsoft的janusz.lembicz与我联系,讨论您的方案的详细信息。