我在Blob存储中有一组PDF文档,这些文档已作为数据源添加到Azure搜索实例中。当我为这些文档建立索引时,所有旋转(即横向格式)的文本都不会建立索引。这些旋转的页面不是图像,而是文本。如果我旋转文本并重新生成PDF,则可以搜索旋转后的文本。
这是设计使然吗?有没有办法让旋转后的文本可搜索?
另一个奇怪的地方-原始PDF是v1.3,当我重新生成它(在Docuprinter中)时,它生成为v1.4。使用此版本,我可以搜索旋转和不旋转的文本。
谢谢!
答案 0 :(得分:1)
该行为不是设计使然,这是我们在文档破解阶段要解决的问题。 如果您想跟踪此类问题的解决方案,请创建一个UserVoice请求。 https://feedback.azure.com/forums/263029-azure-search
谢谢! 路易斯·卡布雷拉(Luis Cabrera)-首席PM(Azure搜索)