python - 最佳的字符识别算法

时间：2016-12-25 04:56:25

标签： python opencv ocr

我正在尝试从视频中创建一个硬编码的字幕开膛手。

到目前为止，我已经做了一些预处理。

字符识别的主要部分仍未完成。我尝试使用tesseract，但准确率约为60％。此外，我尝试训练角色图像，然后比较它们。但是当我运行不同分辨率的视频时，它失败了。

以下是迄今为止的结果。（原始图像，阈值，文本增强，分隔字符）

我确实通过K Means并使用结构相似性比较图像。但在我的情况下没有任何效果。如上所示，图像文字非常清晰。

编辑：

问题：我希望将准确率提高到95％或更高，因为所有视频中的文字相似，我能够获得如上所示的明文或字符。在我的案例中，哪种方法最好？

答案 0 :(得分：2)

我建议两件事：

使用图像清理播放更多内容
获得更好的OCR。 Tesseract是免费的，但不是最好的。如果您的预算允许，您可以查看一些纪念性的。例如：OCRSDK.com这个有一些免费识别，至少足以发挥，看看它是否适合你。

我在demo page上尝试了你的最新照片（经过一次清洁之后），它被认为几乎完全正确 - 见下文。比60％的错误要好得多。我相信通过更好的图像预处理，您可以进一步提高准确性。

免责声明：我为ABBYY工作。