Azure搜索:仅Blob索引创建

时间:2019-11-07 03:45:54

标签: azure-cognitive-search azure-search-.net-sdk

我们只希望对Blob数据(包括在Blob上标记的内容和元属性)启用Azure搜索。

是否可以在没有任何数据库引用的情况下使用这样的Indexer&Index?在这种情况下如何指定索引字段?字段是否与在Blob上标记的元属性相同?

此外,我们有某些字段,其中可能包含来自两种不同语言的数据。是否可以在索引中两次添加相同的字段,并在每个字段上指定不同的语言分析器?

是否可以将同一索引器与两个不同的索引相关联?

是否可以将多个“存储帐户容器”指定为同一索引的数据源?

理想情况下,我们希望能够执行以下操作;

  1. 在多个索引中使用同一索引器
  2. 启用相同的索引器/索引以能够使用语言分析器搜索多种语言
  3. 仅基于Blob及其元属性数据启用索引

1 个答案:

答案 0 :(得分:0)

此doc主题说明了如何设置对blob数据的搜索:https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage

默认的dataToExtract参数值为contentAndMetadata,这意味着将对所有文本内容和元数据建立索引。您应该能够设置从元数据和内容到索引的字段映射(详细信息在同一文档主题中概述)。

索引器指向应该输出到的索引,所以我认为不可能对多个索引重复使用同一索引器,而必须复制它们。

类似地,索引器指定从中获取数据的数据源,因此每个索引器仅一个数据源。如果要根据多个来源的数据建立索引,则需要先将数据汇总到一个来源。

通过为每个索引字段指定相关的分析器,可以在单个索引中为多种语言建立索引。可以在以下主题中找到更多详细信息:https://docs.microsoft.com/en-us/azure/search/search-language-support