Tesseract:输出不同/如何确定给定运行中正在使用哪些参数?

时间:2019-09-04 18:43:25

标签: ocr tesseract

考虑这张小png图像,在白色背景上以黑色描绘单词“ Account”:

A png image of the word 'Account' in black on a white background

对于此真实图像,在以下两个Tesseract命令行操作之间的输出有所不同,(A)优于(B)。 (B)对我来说是必需的,因为用户希望控制Tesseract的660个配置参数-但要达到(A)的提取性能。

案例A(无配置文件):

tesseract -v test.png test

tesseract 4.1.0
 leptonica-1.78.0
  libgif 5.1.4 : libjpeg 9c : libpng 1.6.37 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.3 : libopenjp2 2.3.1
 Found AVX2
 Found AVX
 Found SSE
Tesseract Open Source OCR Engine v4.1.0 with Leptonica

cat test.txt

Account
^L

案例B(使用配置文件,这显然是可取的):

tesseract --print-parameters > tess_default.cfg
tesseract -v test.png test test_default.cfg
ccot
^L      Page separator (default is form feed control character)

我认为两种情况下的输出应该相同,但事实并非如此。 为什么? 情况A 的输出明显更准确,但情况B 的输出不准确。

如果不使用--print-parameters,如何发现Tesseract的当前配置?

请仅考虑* nix下的Tesseract命令行-此时不使用python,Java SDK等。

谢谢!

  • Tesseract版本:4.1.0
  • 提交编号:[已执行:brew install tesseract]
  • 平台:macOS High Sierra 10.13.6 / Darwin redacted.office 17.7.0 Darwin Kernel版本17.7.0:PDT 2019年6月2日20:31:42;根目录:xnu-4570.71.46〜1 / RELEASE_X86_64 x86_64

0 个答案:

没有答案