从表中提取数据时,Tesseract会给出错误的结果

时间:2018-05-27 10:02:48

标签: c# tesseract

我想使用Tesseract从表中提取文本。 文本提取得很好,但我也得到一些奇怪的输出,我不知道它来自哪里。奇怪的输出从第9列开始。 Tesseract开发人员建议的图像有300dpi,我正在使用C#的包装器来实现Tesseract 3.04。我也尝试删除这些行,但这没有帮助。

我可以做些什么来增强图像,以便获得正确的结果? 作为参考,这是图像和输出。

原始图片:enter image description here

以下是显示错误结果的输出的一部分:enter image description here

感谢您的帮助

0 个答案:

没有答案