无论如何使用ImageMagick处理像this这样的图像,以便我可以使用tesseract-ocr将其转换为文本吗?
由于背景中的线条,我从传统方法中得到了废话。有谁知道如何处理像这样的图像?
'convert -density 300 -units PixelsPerInch -type Grayscale + compress input.png input.tif'后跟'tesseract input.tif output -l eng'给了我彻底的垃圾。
或者有没有ImageMagick的替代品,我可以用它来预处理这样的图像,无论是通过命令行还是在python中?