当我使用tesseract将上面的图像转换成可搜索的pdf时,生成的pdf会有白色和黑色的倒置(我不要想要)。我正在使用的特定命令是tesseract my_img.png test pdf
。我是在做错什么,还是在图像上引起这种现象?
我有tesseract --version
tesseract 3.05.02
leptonica-1.77.0
libjpeg 9c : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.0 : libopenjp2 2.3.0
我正在macOS 10.14.2上运行(以防万一)。
答案 0 :(得分:0)
您的tesseract版本可能存在提到的here错误。
我刚刚在计算机上本地测试了您的图像。并且输出未反转。
我有
junglefox@ubuntu:~$ tesseract --version
tesseract 4.0.0-beta.1
leptonica-1.75.3
libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
Found AVX2
Found AVX
Found SSE
如github上的错误链接中所述,“问题已在4.0.0-beta.1-21-gbdf6629版本中使用leptonica-1.75.3解决”。