tesseract无法识别某些文字图像。
例如,考虑以下rails
无法被tesseract识别的图像
OCR时上面的图像没有输出。
有些图像的准确度达不到标准。
我在rails上使用ruby并实现tesseract OCR文本识别我正在使用'gem tesseract'和一些代码。 问题是什么?如何准确地获得输出。
答案 0 :(得分:2)
问题在于Tesseract适用于仅包含文本的图像。不保证您所发布的图像的结果。
您需要进行一些图像处理(仅将图像裁剪为文本部分),并将图像转换为黑白文本背景。