标签: python opencv ocr
我正在尝试从视频中创建一个硬编码的字幕开膛手。
到目前为止,我已经做了一些预处理。
字符识别的主要部分仍未完成。我尝试使用tesseract,但准确率约为60%。此外,我尝试训练角色图像,然后比较它们。但是当我运行不同分辨率的视频时,它失败了。
以下是迄今为止的结果。 (原始图像,阈值,文本增强,分隔字符)
我确实通过K Means并使用结构相似性比较图像。但在我的情况下没有任何效果。如上所示,图像文字非常清晰。
编辑:
问题:我希望将准确率提高到95%或更高,因为所有视频中的文字相似,我能够获得如上所示的明文或字符。在我的案例中,哪种方法最好?
答案 0 :(得分:2)
我建议两件事:
我在demo page上尝试了你的最新照片(经过一次清洁之后),它被认为几乎完全正确 - 见下文。比60%的错误要好得多。我相信通过更好的图像预处理,您可以进一步提高准确性。
免责声明:我为ABBYY工作。