我有几个小时的讲座,连续的解释发生。 (我真的是指几个,它是一个庞大的数据库)。连续的解释意味着讲师讲了一点,然后,在他停顿后,口译员将他刚才所说的内容翻译成听众。
讲师用英语讲话,然后翻译翻译成当地语言(他在世界各地讲课,所以"当地语言"可以是任何东西)。
我被指控从音频中删除口译员的声音,只留下讲师。
我需要一些关于实现这一目标的最简单方法的指导。我想这是一个非常简单的任务,因为讲师和翻译之间绝对没有语音重叠。
这项任务的最佳工具是什么?狮身人面像?朱利叶斯?别的什么?请帮忙。
答案 0 :(得分:0)
它被称为扬声器diarization,你可以检查
http://www-lium.univ-lemans.fr/diarization/doku.php/quick_start