Question

我有英文和法文的视频游戏字幕数据集以及英文字幕的音频文件。英文字幕在其中指定了与其各自的音频文件匹配的静音。例如，

[Silence 3] Some narrated text goes here. [Silence 2] Some more text goes here.

（[沉默3]中的3表示静音持续时间）。

我的任务是提供一个程序，将沉默添加到法语字幕，以便输出：

[Silence 3] Certains textes narratifs vont ici. [Silence 2] Un peu plus de texte va ici.

我已经有法语字幕的答案，我应该用它来验证算法的有效性。我正在考虑使用已经给出的答案教我的算法进行机器学习方法，但我不确定什么是最好的算法类型，或者如果这是在这种情况下的方法。我也发现音频文件没用。解决这个问题的最佳方法是什么？

编辑：并非所有句子都像我之前给出的例子一样，有时沉默就在句子的中间。

Answer 1

如果我是你，我会忘记机器学习方法，只需将文本分成句子。

sentence 1
sentence 2
SILENCE
sentence 3
SILENCE

抓取相应的翻译，然后在适当的位置插入沉默（在位置2和3之后）。