我在我的应用程序中使用tesseract库进行图像扫描。我已经阅读过某个地方,图书馆为超过100 DPI的图像提供了良好的性能。我正在使用iPhone 4和iPad拍摄照片,并将其作为tesseract库的输入。但仍然库提供不可读的输出。什么是iPhone的DPI或iPad相机?我如何提高tesseract库的性能?
答案 0 :(得分:4)
获得12英寸标尺和卷尺。把尺子放在桌子上。将手机放在标尺上方,将相机对准标尺。使用卷尺测量从标尺到相机的距离。拍一张统治者的照片。
在图像查看器或编辑器中打开照片。 (例如,您可以在Mac上使用“预览”。)使用图像查看器/编辑器以像素为单位测量标尺的大小。
将标尺的大小(以像素为单位)除以12.即从使用卷尺测量的距离取得的标尺图片的每英寸像素(也称为每英寸点数或DPI)。 / p>
关于需要100 DPI 的要点是OCR库需要足够的分辨率来识别字母。它可能希望字母高15-20像素(我猜)。如果字母太小,图像可能没有足够的信息供OCR库工作。字母也可能太大了 - 图书馆可能没有编程来寻找100像素高的字母。如果字母大小合适但模糊,OCR库可能无法识别它们。
可能只是因为您正在尝试拍摄太小的文字图片,因此当您将相机靠得足够近以使字母尺寸合适时,相机无法对焦且图像模糊。在这种情况下,你可能无法修复它(除了拿一部带有更好相机的手机)。
答案 1 :(得分:0)
它有72 dpi,至少这是它存储在EXIF中的内容