如何创建视频OCR?

时间:2013-10-07 11:50:27

标签: image-processing ocr

我在win form C#应用程序中工作。 应用程序从视频设备(如电视/相机或输入视频文件)中获取图像。 然后处理它并将其保存在文本文档中。

我的问题是,“如何创建数字视频OCR?”

请建议我任何教程/链接/源代码。

5 个答案:

答案 0 :(得分:1)

从OCR部分的tesseract-ocr .net engine和相机方法的Emgu CV开始。祝你好运。

答案 1 :(得分:1)

由于视频OCR仍然是一个活跃的研究课题,您可能需要付出更多努力来开发自己的视频OCR引擎。基本上,视频OCR框架可以基于视频场景剪切检测,文本检测和视频剪切识别来构建。

使用场景剪切检测作为预处理步骤,以降低计算成本;然后在视频剪切帧中本地化文本内容的位置和边界;通过使用适当的文本分段和二值化技术从背景中分离文本像素。最后,可以应用打印OCR引擎来获取Text结果。

如果您只是处理少量视频数据,则可以在mashape上使用free video OCR rest API

答案 2 :(得分:0)

如果您或其他任何人正在处理此问题,我发现this site非常有帮助 基本上,视频转换为静止图像,处理这些图像以优化OCR结果,然后每个图像都被OCR编辑。

答案 3 :(得分:0)

以前的一些工作可能是相关的:

答案 4 :(得分:0)

Google Cloud提供了视频OCR API。 https://cloud.google.com/video-intelligence/docs/text-detection

您可以直接在视频中调用此API。它将返回文本边界框,并且它是与您的视频相关联的时间戳。