为什么在此图像上使用tesseract时颜色会反转?

时间:2019-01-14 02:41:02

标签: image-processing pdf-generation tesseract

sample problem image

当我使用tesseract将上面的图像转换成可搜索的pdf时,生成的pdf会有白色和黑色的倒置(我不要想要)。我正在使用的特定命令是tesseract my_img.png test pdf。我是在做错什么,还是在图像上引起这种现象?

我有tesseract --version

 tesseract 3.05.02
 leptonica-1.77.0
  libjpeg 9c : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.0 : libopenjp2 2.3.0

我正在macOS 10.14.2上运行(以防万一)。

1 个答案:

答案 0 :(得分:0)

您的tesseract版本可能存在提到的here错误。

我刚刚在计算机上本地测试了您的图像。并且输出未反转。

我有

junglefox@ubuntu:~$ tesseract --version
tesseract 4.0.0-beta.1
 leptonica-1.75.3
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0

 Found AVX2
 Found AVX
 Found SSE

如github上的错误链接中所述,“问题已在4.0.0-beta.1-21-gbdf6629版本中使用leptonica-1.75.3解决”。