答案 0 :(得分:1)
不要指望Tesseract开箱即用。在将此图像放入Tesseract之前,需要做一些工作。
我会进行以下预处理:
这些预处理步骤确实很容易手动编程,但是当然有很多具有此功能的库。
答案 1 :(得分:0)
我不知道没有任何现成的软件可以在没有大量其他配置的情况下对特定图像进行文本提取,但是您可以改善Tesseract的结果
您可以尝试处理图像,以便Tesseract更容易识别它,在Tesseract完成自动调整后,使用tessedit_write_images true
查看图像
这可能不是最好的,所以您可以使用许多可用的库/程序自己进行调整,您的目标应该是将其转换为黑白文本图像,并尽可能减少噪音
为此,请阅读:ImproveQuality
您还可以尝试针对您的特定数据训练Tesseract,但这将需要更多的工作,并且需要大量的训练数据,请阅读:TrainingTesseract 4.0