我有英文和法文的视频游戏字幕数据集以及英文字幕的音频文件。英文字幕在其中指定了与其各自的音频文件匹配的静音。例如,
[Silence 3] Some narrated text goes here. [Silence 2] Some more text goes here.
([沉默3]中的3表示静音持续时间)。
我的任务是提供一个程序,将沉默添加到法语字幕,以便输出:
[Silence 3] Certains textes narratifs vont ici. [Silence 2] Un peu plus de texte va ici.
我已经有法语字幕的答案,我应该用它来验证算法的有效性。我正在考虑使用已经给出的答案教我的算法进行机器学习方法,但我不确定什么是最好的算法类型,或者如果这是在这种情况下的方法。我也发现音频文件没用。解决这个问题的最佳方法是什么?
编辑:并非所有句子都像我之前给出的例子一样,有时沉默就在句子的中间。
答案 0 :(得分:0)
如果我是你,我会忘记机器学习方法,只需将文本分成句子。
sentence 1
sentence 2
SILENCE
sentence 3
SILENCE
抓取相应的翻译,然后在适当的位置插入沉默(在位置2和3之后)。