Azure搜索中的内容提取问题,包含图像文件的blob存储

时间:2018-04-20 02:43:12

标签: azure-search azure-blob-storage

我的要求是搜索思考图像中的内容"和pdf内的图像内容。

我选择了blob存储来保存所有文件。我包括pdf,xml,text,png,jpeg等文件类型。

我应该能够搜索图像中的内容(甚至图像在pdf中)。我看到blob存储不支持提取图像文件内容的microsoft文档。

我遇到了选项" AzureSearch_SkipContent",它将允许搜索图像的元数据(不支持的)文件。

我的问题是,搜索认为图像文件的内容不仅仅是blob存储,或者甚至不可能在下面的所有存储选项中。 •Azure SQL数据库 •Azure VM上的SQL Server关系数据 •Azure Cosmos DB •Azure Blob存储 •Azure表存储

提前致谢。

1 个答案:

答案 0 :(得分:1)

更新2018年5月21日

此功能现在可供所有客户使用,作为Azure搜索的认知搜索功能的一部分。

原始回复:

Azure Search正在启动对Azure blob存储中的图像文件的OCR支持的私有预览,以及PDF /扫描PDF中的图像。 如果您想参加,请联系。我将在下面添加联系信息作为评论。