我有一个 Azure 认知搜索索引,它为来自多个数据源的数据编制索引。每个数据源都使用几乎相同的索引器进行索引。每个索引器调用相同的技能组配置。
在索引定义中,我有一个标记为 "datasource"
的字段,用于标识特定文档的数据源。我想有索引器或使用模块化技能,例如条件技能,根据数据源设置此字段的值。我知道如果找不到值,可以对字段的值使用条件技能,但我想避免必须为每个索引器创建新的技能集。我的数据源是 Blob 容器中的多种类型的文档。
仅使用索引器定义就可以在定义中手动将字段的值分配给字符串,方法是通过某种方式提取数据源的名称,或在技能集定义?
我一直在寻求的一条途径是在容器级别设置用户指定的 blob 元数据。但是,我无法使用索引器或技能集成功检索此信息。我不想在容器中的每个 blob 上设置这个用户指定的 blob 元数据。
答案 0 :(得分:0)
遗憾的是,无法以将唯一信息传递给技能组的方式配置 blob 数据源。每个数据源拥有单独的技能集可能是最干净的选择。或者,您可以将 metadata_storage_path 传递给 custom skill 并解析容器路径以通过约定或映射返回值。