用于tesseract输入的灰度的最佳算法

时间:2015-01-09 16:33:42

标签: algorithm tesseract grayscale

我正在使用tesseract库来识别单词的项目。它没有像我预期的那样工作,有时,它失败了完整的聚焦图像。我发现,在我的灰度步骤不是很好之后,原因就是图像。

我使用的算法来自zxing项目:

int grey = yuv[inputOffset + x] & 0xff;
pixels[outputOffset + x] = (grey * 0x00010101) | 0xFF000000;

对于这种情况有没有更好的解决方案?

更新: 我尝试在裁剪和转换后打印图像,我得到了一个预期尺寸但不是颜色的裁剪图像。看起来图像被转换为​​"紫绿色"图片。任何人都可以帮助我:(?

2 个答案:

答案 0 :(得分:0)

较旧的版本确实需要8位灰度tiff才能获得良好的效果。但是如果你使用版本> 3,那么最好的算法就是不进行任何图像预处理。至少如果你没有特殊要求。 如果您有红色字符(0xFF000000仅使用红色通道),zxing的算法会很好。

答案 1 :(得分:0)

调整输入图像的大小,确保您获得Tesseract所享有的x高度,以及使用Otsu或通过Open CV进行自适应阈值处理,并且开放和扩展等一些形态滤波器提供了一组良好的预处理过滤,可产生良好的结果,具体取决于您的输入需要尝试打开/扩张的配置。