大文件的全文索引(超过32k)

时间:2016-05-10 21:36:29

标签: azure-search

是否可以在超过32kB的blob上使用Azure Search?我在Azure上有大约500GB的文本文件存储为blob。平均blob大小约为1MB。我很高兴尝试使用Azure搜索对文件进行全文搜索。但是,它看起来像索引字段Edm.String不能超过32kB。我无法在任何地方找到这个确切的限制,我从门户网站的错误消息中提取了这些信息。

Azure上是否有可用于在Blob上添加全文搜索功能的开箱即用解决方案? Azure团队是否计划删除32kB字段大小?

1 个答案:

答案 0 :(得分:4)

这里可能有两个不同的限制:

  1. Azure搜索对从Blob中提取的字符数有限制,具体取决于定价层。对于免费套餐,该限制为32 * 1024个字符。对于标准S1和S2定价层,它有400万个字符。

  2. 另外,搜索索引中单个术语的大小也有限制 - 它也恰好是32KB。如果搜索索引中的content字段标记为filterablefacetablesortable,那么您将达到此限制(无论该字段是否标记为是searchable。通常,对于大型可搜索内容,您希望启用searchable,有时启用retrievable,但不启用其他内容。这样,您就无法从索引端获得内容长度限制。

  3. 我们意识到第一个限制特别是现在没有记录;我们很快就会在配额和限制页面中反映这一点。