答案 0 :(得分:2)
预计索引大小会有所不同。对于文档中的每个单词,Microsoft分析器会生成原始单词和该单词的基本形式,例如,如果您的文档中包含单词 ,则Azure搜索将索引两个术语:正在运行和运行。有关详细信息,请参阅以下帖子中的我的回答:Azure Search: Searching for singular version of a word, but still include plural version in results
Lucene分析器干预了导致索引中唯一项不足的原因。 您可以在此处详细了解差异:https://docs.microsoft.com/en-us/rest/api/searchservice/Language-support?redirectedfrom=MSDN
根据分析器/语言,对索引大小的影响会有所不同。您可以使用Analyze API测试您正在使用的分析仪的行为:https://docs.microsoft.com/en-us/rest/api/searchservice/test-analyzer。
话虽如此,你所看到的差异超出了我的预期。请通过microsoft的janusz.lembicz与我联系,讨论您的方案的详细信息。