image-processing - 在屏幕截图上提高Tesseract OCR的准确性

时间：2019-06-19 11:55:13

标签： image-processing ocr tesseract training-data

屏幕截图上的tesseract OCR给出了非常不稳定的结果。即使图像是完全黑色的，上面带有白色文本，也似乎只能正确识别某些文本。即使在将图像调整为300dpi大小之后，精度仍然很低，并且大多数文本都是乱码。

上阅读了关于StackOverflow的类似问题。

如前所述，问题的作者通过使用其字体训练tesseract引擎能够获得近100％的准确性。

我图像中的字体是Arial。我如何仍能提高准确性？

以下是我拥有的图像类型的示例： Image Sample

答案 0 :(得分：1)

您可以通过更改--psm和--oem值来使用OCR的配置

尝试： --psm 5 --oem 2

您也可以查看以下链接以获取更多详细信息 here

答案 1 :(得分：0)

这个问题很老，但在谷歌搜索中排在第一位，所以我想，我会回答。我有一个非常相似的问题，以为我会发疯，但后来偶然发现了这个页面：https://tesseract-ocr.github.io/tessdoc/ImproveQuality

那里说：反转图像虽然 tesseract 3.05 版（及更早版本）可以毫无问题地处理倒置图像（深色背景和浅色文本），但对于 4.x 版本，在浅色背景上使用深色文本。

我使用 ImageMagick 对图像进行了否定，然后就可以了：100% 匹配！