由于缺少内容类型,索引器无法处理blob,但blob具有内容类型

时间:2016-07-11 15:21:00

标签: azure-storage-blobs azure-search

我为Azure设置blob索引和全文搜索,如本文所述:Indexing Documents in Azure Blob Storage with Azure Search

然而,我的一些pdf在索引器中失败了:

[
    {
        "key": null,
        "errorMessage": "Error processing blob 'https://my-storage.blob.core.windows.net/my-container/mydocument.pdf' with content type '': 422"
    }
]

我仔细检查了blob上的属性,以确保其内容类型已设置:

{
    "container": "my-container",
    "name": "mydocument.pdf",
    "metadata": {},
    "lastModified": "Fri, 08 Jul 2016 19:43:15 GMT",
    "etag": "0xXXXXXXXXXXXXXXX",
    "blobType": "BlockBlob",
    "contentLength": "3863790",
    "requestId": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
    "contentSettings": {
        "contentType": "application/pdf",
        "contentMD5": "xxxxxxxxxxxxxxxxxxxxxx=="
    },
    "lease": {
        "status": "unlocked",
        "state": "available"
    }
}

现在,这个特殊的pdf有一些安全限制(没有打印),所以我认为这可能会影响它。我从零开始创建了一些pdf来测试它,并且它们都运行得很好,无论有没有限制。

1 个答案:

答案 0 :(得分:0)

由于安全限制,文件损坏等原因,Azure Search偶尔会出现无法处理的文档。还有几个旋钮可以控制这些文件的处理方式。有关详细信息,请参阅this answer