我遇到了OCR的一个奇怪问题。基本上,我正在从一个iphone应用程序,通过我的服务器到一个OCR端点(ocrapiservice.com,FWIW)发布jpg。照片包含漂亮,清晰的文字,大小足够大(2500多像素宽)。但是,结果难以理解:
n. E o U > CO CO a £ O a p a h o .8 U o...
如果我将相同的图像上传到ocrapiservice的测试门户(一旦图像从iphone到达我的服务器,我自己给我发送电子邮件的副本),结果是一样的。
我在Photoshop中打开相同的图像,并且在不做任何其他操作的情况下,使用不同的文件名“另存为”。文件大小几乎翻倍(for this reason, I guess)。现在,如果我上传这个图像,结果接近完美,没有随机字符或无法理解的位。
总而言之,这两个图像的尺寸,分辨率,色彩空间等都是相同的。唯一的区别是我在Photoshop中保存了一倍,文件大小翻了一倍。
另一个奇怪的方面是,如果我保存 - 如在Photoshop中,但选择一个中等jpeg压缩级别,导致新文件大小与原始图像大致相同,保存为图像仍然提供良好结果而同样大小的原件是胡言乱语。
我不知道Photoshop正在做些什么来让这些图像很好地读入OCR,但任何指导都会非常感激!特别是有关如何在我的iPhone应用程序中对我的UIImage数据执行相同操作以使OCR在直接进行POST时能够正常工作的任何提示。
谢谢!
答案 0 :(得分:1)
感谢您的快速反应,伙计们。原来这是图像方向的问题。 Photoshop会读取iPhone设置的标记并相应地修复方向,而直接发布图像会将其删除。应该知道!