Question

我正在使用tesseract库来识别单词的项目。它没有像我预期的那样工作，有时，它失败了完整的聚焦图像。我发现，在我的灰度步骤不是很好之后，原因就是图像。

我使用的算法来自zxing项目：

int grey = yuv[inputOffset + x] & 0xff;
pixels[outputOffset + x] = (grey * 0x00010101) | 0xFF000000;

对于这种情况有没有更好的解决方案？

更新：我尝试在裁剪和转换后打印图像，我得到了一个预期尺寸但不是颜色的裁剪图像。看起来图像被转换为＆＃34;紫绿色＆＃34;图片。任何人都可以帮助我:(？

Answer 1

较旧的版本确实需要8位灰度tiff才能获得良好的效果。但是如果你使用版本> 3，那么最好的算法就是不进行任何图像预处理。至少如果你没有特殊要求。如果您有红色字符（0xFF000000仅使用红色通道），zxing的算法会很好。

Answer 2

调整输入图像的大小，确保您获得Tesseract所享有的x高度，以及使用Otsu或通过Open CV进行自适应阈值处理，并且开放和扩展等一些形态滤波器提供了一组良好的预处理过滤，可产生良好的结果，具体取决于您的输入需要尝试打开/扩张的配置。