我知道我们可以使用ocr从图像中提取文本。但我需要提取视频中的文字,就像视频讲座中那样。或者换句话说,是否可以将视频转录为文本。那可能吗?如果是这样,请建议我如何用java或任何其他语言来做。
答案 0 :(得分:2)
我天真的Linux驱动方法是:
这主要取决于你的OCR工作的好坏和速度。对我来说,其他一切都是经过验证的软件。该语言可能是bash-shell-script,因为组件可能是单独的linux程序。正如我所提到的,它取决于OCR的质量,性能和运行时环境。
答案 1 :(得分:1)
这主要取决于你的OCR工作的好坏和速度。
同意。作为起点,Google Cloud vision OCR或OCRspace online OCR在“背景文字”情况下工作得非常好。我自己用它来提取字幕。
要测试OCR质量是否足以满足您的使用需求,您可以使用Copyfish Chrome/Firefox插件(来自ocr.space)。
答案 2 :(得分:0)
是的,您可以做到这一点,有3种方法可以实现它。
自行拆分,分类和训练。
获取性能服务器,
A.从视频中提取图像
B.开发和训练您的机器学习模型。您可以使用张量流执行相同的操作。
注意:如果您希望自己训练模型,请确保您有足够的时间,因为有时开发和训练需要几个月的时间,并且您应该掌握训练数据。
USE API(免费增值模型)。市场上有很多。只是谷歌他们,你将有很多在手。