Question

我有两张TIF图片。第一张图片（a.tif）是：

和第二张图片（bcd.tif）是

当我使用 “tesseract a.tif a.txt” 时，它不会读取该字符和相同的命令 “tesseract bcd。 tif bcd.txt“ 正在工作。我已经在stackoverflow中看到了一些答案，他们没有给出解决方案如何运行它。如果我们需要添加任何参数那些是什么？

Answer 1

似乎该问题与图像中只有一个字符有关。例如，我尝试了这两个图像：

这个工作正常。 Tesseract报告结果有95％的信心：

这个不起作用。

我还尝试将PageSegMode设置为SingleChar扫描该图像，然后将其扫描完好。

该命令行参数应为-psm 10。请参阅：https://stackoverflow.com/a/26418458/5894241

Answer 2

正如您所说的，您需要将模式更改为单字符模式，您可以使用以下命令在python中进行操作

pytesseract.image_to_string(img_path , config="--psm 10")

Python OCR Tesseract无法识别单个字符

2 个答案: