语音识别:从音频中切断翻译人员的语音

时间:2016-11-03 12:55:06

标签: voice-recognition speech

我有几个小时的讲座,连续的解释发生。 (我真的是指几个,它是一个庞大的数据库)。连续的解释意味着讲师讲了一点,然后,在他停顿后,口译员将他刚才所说的内容翻译成听众。

讲师用英语讲话,然后翻译翻译成当地语言(他在世界各地讲课,所以"当地语言"可以是任何东西)。

我被指控从音频中删除口译员的声音,只留下讲师。

我需要一些关于实现这一目标的最简单方法的指导。我想这是一个非常简单的任务,因为讲师和翻译之间绝对没有语音重叠。

这项任务的最佳工具是什么?狮身人面像?朱利叶斯?别的什么?请帮忙。

1 个答案:

答案 0 :(得分:0)

它被称为扬声器diarization,你可以检查

http://www-lium.univ-lemans.fr/diarization/doku.php/quick_start