我正在进行一个侧面项目,我正在通过电视和电影节目搜索短语和单词。我想知道是否有一个应用程序可以为节目/系列/电影获取字幕并确保它们是txt格式的?
我想通过名字开始一个电视节目/电影的片段,并获得每集的字幕文本文件。
这是一个选择吗?
答案 0 :(得分:1)
您可以使用我开发的这个开源项目完成相同的操作。 https://github.com/atulgpt/SubtitleDownloader.git它还支持批处理模式,递归文件夹搜索和两个不同的数据库。为了获得更好的效果,它使用视频文件的哈希值。如果发现有用,请给项目一个明星并向上投票这个答案:)
答案 1 :(得分:0)
我不知道您的源媒体是什么,但假设您使用的是视频光盘, ffmpeg 可用于提取字幕。该命令看起来像这样:
ffmpeg -i /path/to/some/file -an -vn -c:s:1 srt sub1.srt
表示从某些/文件中提取忽略音频,忽略视频,并从第一个流中提取字幕。您也可以使用ffmpeg来分析流。
它将提取为一个人类可读文本格式的srt文件