机器学习方法为翻译的字幕添加沉默

时间:2016-03-28 21:41:39

标签: algorithm audio machine-learning synchronization neural-network

我有英文和法文的视频游戏字幕数​​据集以及英文字幕的音频文件。英文字幕在其中指定了与其各自的音频文件匹配的静音。例如,

[Silence 3] Some narrated text goes here. [Silence 2] Some more text goes here.

([沉默3]中的3表示静音持续时间)。

我的任务是提供一个程序,将沉默添加到法语字幕,以便输出:

[Silence 3] Certains textes narratifs vont ici. [Silence 2] Un peu plus de texte va ici.

我已经有法语字幕的答案,我应该用它来验证算法的有效性。我正在考虑使用已经给出的答案教我的算法进行机器学习方法,但我不确定什么是最好的算法类型,或者如果这是在这种情况下的方法。我也发现音频文件没用。解决这个问题的最佳方法是什么?

编辑:并非所有句子都像我之前给出的例子一样,有时沉默就在句子的中间。

1 个答案:

答案 0 :(得分:0)

如果我是你,我会忘记机器学习方法,只需将文本分成句子。

sentence 1
sentence 2
SILENCE
sentence 3
SILENCE

抓取相应的翻译,然后在适当的位置插入沉默(在位置2和3之后)。