Azure 认知搜索索引器 blob 存储

时间:2021-01-11 10:42:26

标签: azure-blob-storage azure-cognitive-search azure-cognitive-services indexer

我陷入了一个复杂的境地,如果有人能提供帮助,我将不胜感激。

所以我正在测试索引 blob 存储(pdf 文件)并在 qa 环境中索引我的存储副本,这花了我一些钱。

我的问题是: 有没有什么解决方案可以在生产中使用这个索引而不需要再次索引?

我找到了一个复制索引的解决方案,并且工作正常,但是当我添加一个连接到生产 blob 存储的索引器时,它会再次从头开始索引(正如我预期的那样)。有没有办法解决这个问题?有没有办法让indexer从现在开始索引?

我尝试通过将订阅更改为 prod 来使用我已有的索引和索引器。但是我必须更改索引器的数据源以指向生产 blob 存储,在这种情况下我收到错误:

索引器“filesIndexer”当前引用数据源“qafilesds”并且无法更新以引用不同的数据源“prodfilesds”,因为它具有非空的更改跟踪状态,或者当前正在进行中。您可以使用 Reset API 在不再进行时重置索引器的更改跟踪状态,然后重试此调用。

1 个答案:

答案 0 :(得分:0)

对您的第一个问题的简单回答是简单地使用您构建的 qa 索引。

一个更复杂的答案是从您现在使用的推送模型切换到拉取模型。根据您上面的解释,我假设您的所有内容都来自 blob 存储。并且您已经配置了一个索引器来为您进行索引。这就是所谓的拉模型。

另一种方法是使用 Azure 认知搜索 SDK 编写自己的应用程序,将内容提交给索引。在这种情况下,您不使用内置索引器,只使用索引本身。然后您可以自由使用任何您想要确定索引和跳过的逻辑。您甚至可以让您的存储帐户在内容更新时通过事件通知您的应用程序。