标签: c# tesseract
我想使用Tesseract从表中提取文本。 文本提取得很好,但我也得到一些奇怪的输出,我不知道它来自哪里。奇怪的输出从第9列开始。 Tesseract开发人员建议的图像有300dpi,我正在使用C#的包装器来实现Tesseract 3.04。我也尝试删除这些行,但这没有帮助。
我可以做些什么来增强图像,以便获得正确的结果? 作为参考,这是图像和输出。
原始图片:
以下是显示错误结果的输出的一部分:
感谢您的帮助