最佳的字符识别算法

时间:2016-12-25 04:56:25

标签: python opencv ocr

我正在尝试从视频中创建一个硬编码的字幕开膛手。

到目前为止,我已经做了一些预处理。

  1. 获取字幕框
  2. 裁剪字幕行
  3. 单独的字幕行
  4. 单独的字符。
  5. 字符识别的主要部分仍未完成。我尝试使用tesseract,但准确率约为60%。此外,我尝试训练角色图像,然后比较它们。但是当我运行不同分辨率的视频时,它失败了。

    以下是迄今为止的结果。 (原始图像,阈值,文本增强,分隔字符)

    Original Image

    Threshold with 254

    Then text enhancement

    Separating each character

    我确实通过K Means并使用结构相似性比较图像。但在我的情况下没有任何效果。如上所示,图像文字非常清晰。

    编辑:

    问题:我希望将准确率提高到95%或更高,因为所有视频中的文字相似,我能够获得如上所示的明文或字符。在我的案例中,哪种方法最好?

    P.S:语言是克罗地亚语

1 个答案:

答案 0 :(得分:2)

我建议两件事:

  1. 使用图像清理播放更多内容
  2. 获得更好的OCR。 Tesseract是免费的,但不是最好的。如果您的预算允许,您可以查看一些纪念性的。例如:OCRSDK.com这个有一些免费识别,至少足以发挥,看看它是否适合你。
  3. 我在demo page上尝试了你的最新照片(经过一次清洁之后),它被认为几乎完全正确 - 见下文。比60%的错误要好得多。我相信通过更好的图像预处理,您可以进一步提高准确性。 enter image description here

    免责声明:我为ABBYY工作。