Azure Blob Indexer的问题

时间:2017-10-10 10:41:02

标签: azure azure-search azure-blob-storage

我遇到过一个场景,我想索引blob存储中存在的所有文件。 但是,如果在Blob中上载的文件受密码保护,索引器将失败,索引器现在无法索引其余文件。

[
    {
        "key": null,
        "errorMessage": "Error processing blob 'url' with content type ''. Status:422, error: "
    }
]

是否有办法忽略受密码保护的文件,或者即使某个文件中存在错误,也可以继续使用索引进程。

2 个答案:

答案 0 :(得分:1)

请参阅Controlling which blobs are indexed中的处理不支持的内容类型部分。使用failOnUnsupportedContentType配置设置:

PUT https://[service name].search.windows.net/indexers/[indexer name]?api-version=2016-09-01
Content-Type: application/json
api-key: [admin key]

{
  ... other parts of indexer definition
  "parameters" : { "configuration" : { "failOnUnsupportedContentType" : false } }
}

答案 1 :(得分:0)

  

有没有办法忽略受密码保护的文件或方法   即使某些内容存在错误,也要继续进行索引编制   文件。

一种可行的方法是使用名称AzureSearch_Skip在blob上定义元数据,并将其值设置为true。在这种情况下,Azure搜索服务将忽略此blob并移动到列表中的下一个blob。

您可以在此处详细了解:https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage#controlling-which-parts-of-the-blob-are-indexed