我正在撰写关于语音识别的论文,用于从视频本身生成字幕。这个概念是我计划制作视频播放器并将语音识别功能集成在一起。因此,如果我运行系统并播放视频直到它结束,系统将生成该视频文件的另一个副本,但这次字幕已经包含或集成在该视频文件中。这个概念可能吗?如果是这样,你能告诉我如何做到这一点,或者告诉我什么是最好的SR API或那里有什么?我熟悉java btw。
答案 0 :(得分:0)
在我的大学时代,我的脑海中也有类似的想法。
我认为你的方法应该是有效的。首次播放电影,然后生成字幕并将其导出到“。srt”文件。因为有几个原因,例如
,你不能在实时处理中这样做等
您的方法的缺点是 人们不喜欢播放整部电影来生成字幕文件。
所以我认为提取音轨(音频文件),分析音轨并生成字幕文件而不播放电影会更好
在这里,您无法进行SPEECH-TO-TEXT转换。 您必须找到分析声波样式并提取数据的方法。
祝你好运