考虑这张小png图像,在白色背景上以黑色描绘单词“ Account”:
对于此真实图像,在以下两个Tesseract命令行操作之间的输出有所不同,(A)优于(B)。 (B)对我来说是必需的,因为用户希望控制Tesseract的660个配置参数-但要达到(A)的提取性能。
案例A(无配置文件):
tesseract -v test.png test
tesseract 4.1.0
leptonica-1.78.0
libgif 5.1.4 : libjpeg 9c : libpng 1.6.37 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.3 : libopenjp2 2.3.1
Found AVX2
Found AVX
Found SSE
Tesseract Open Source OCR Engine v4.1.0 with Leptonica
cat test.txt
Account
^L
案例B(使用配置文件,这显然是可取的):
tesseract --print-parameters > tess_default.cfg
tesseract -v test.png test test_default.cfg
ccot
^L Page separator (default is form feed control character)
我认为两种情况下的输出应该相同,但事实并非如此。 为什么? 情况A 的输出明显更准确,但情况B 的输出不准确。
如果不使用--print-parameters
,如何发现Tesseract的当前配置?
请仅考虑* nix下的Tesseract命令行-此时不使用python,Java SDK等。
谢谢!