我为Azure设置blob索引和全文搜索,如本文所述:Indexing Documents in Azure Blob Storage with Azure Search。
然而,我的一些pdf在索引器中失败了:
[
{
"key": null,
"errorMessage": "Error processing blob 'https://my-storage.blob.core.windows.net/my-container/mydocument.pdf' with content type '': 422"
}
]
我仔细检查了blob上的属性,以确保其内容类型已设置:
{
"container": "my-container",
"name": "mydocument.pdf",
"metadata": {},
"lastModified": "Fri, 08 Jul 2016 19:43:15 GMT",
"etag": "0xXXXXXXXXXXXXXXX",
"blobType": "BlockBlob",
"contentLength": "3863790",
"requestId": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"contentSettings": {
"contentType": "application/pdf",
"contentMD5": "xxxxxxxxxxxxxxxxxxxxxx=="
},
"lease": {
"status": "unlocked",
"state": "available"
}
}
现在,这个特殊的pdf有一些安全限制(没有打印),所以我认为这可能会影响它。我从零开始创建了一些pdf来测试它,并且它们都运行得很好,无论有没有限制。
答案 0 :(得分:0)
由于安全限制,文件损坏等原因,Azure Search偶尔会出现无法处理的文档。还有几个旋钮可以控制这些文件的处理方式。有关详细信息,请参阅this answer。