使用tesseract进行困难的文本识别

时间:2012-12-11 07:51:19

标签: ruby-on-rails ruby image-processing crop tesseract

tesseract无法识别某些文字图像。

例如,考虑以下rails无法被tesseract识别的图像

enter image description here

OCR时上面的图像没有输出。

有些图像的准确度达不到标准。

我在rails上使用ruby并实现tesseract OCR文本识别我正在使用'gem tesseract'和一些代码。 问题是什么?如何准确地获得输出。

1 个答案:

答案 0 :(得分:2)

问题在于Tesseract适用于仅包含文本的图像。不保证您所发布的图像的结果。

您需要进行一些图像处理(仅将图像裁剪为文本部分),并将图像转换为黑白文本背景。