Azure搜索索引PDF文档横向文本

时间:2018-12-10 21:09:54

标签: azure-search

我在Blob存储中有一组PDF文档,这些文档已作为数据源添加到Azure搜索实例中。当我为这些文档建立索引时,所有旋转(即横向格式)的文本都不会建立索引。这些旋转的页面不是图像,而是文本。如果我旋转文本并重新生成PDF,则可以搜索旋转后的文本。

这是设计使然吗?有没有办法让旋转后的文本可搜索?

另一个奇怪的地方-原始PDF是v1.3,当我重新生成它(在Docuprinter中)时,它生成为v1.4。使用此版本,我可以搜索旋转和不旋转的文本。

谢谢!

1 个答案:

答案 0 :(得分:1)

该行为不是设计使然,这是我们在文档破解阶段要解决的问题。 如果您想跟踪此类问题的解决方案,请创建一个UserVoice请求。 https://feedback.azure.com/forums/263029-azure-search

谢谢! 路易斯·卡布雷拉(Luis Cabrera)-首席PM(Azure搜索)