我希望为音频文件中的每个单词获得大致准确的时间戳。我还有原始文本与音频文件一起使用,可以用作各种各样的交叉参考源。这类似于“音频挖掘”,我相信这是你只有输入音频的地方,而在这里我有音频和文字。
我希望使用开源软件这样做,并希望接受大多数语言作为输入(例如,英语,法语,德语,西班牙语,理想的俄语和普通话)。
我甚至会接受一种只能匹配各种单词的时间戳的解决方案(例如,如果转录不完全准确的话)。然后将输出文本与原始文本交叉引用以帮助重新调整事物将更容易。
答案 0 :(得分:0)
我在语言学研究中这样做。我使用了一个名为ELAN的程序,我注意到它们的版本(4.5)比我目前在Mac上安装的版本更新。该软件旨在帮助使用聋人语言,因此它支持视频和音频帧,并允许您准确地对齐您的转录。我使用的版本是3.9,该版本用于对文字进行某种自动分段,这是我认为你想做的事情。我没有在最新版本上看到这个功能,也许有一些挖掘它仍然存在。
来自this page的。
当然,如果您需要早期版本,可以随时使用ELAN 3.9。 ELAN适用于Mac,Linux和Windows,因为它基于Java(我记得)。这是ELAN的链接。还有其他语言注释软件。另一个非常好,但很难学习。它被称为PRAAT。
我希望这会对你有所帮助。如果我不能正确理解你的需求,请告诉我,我会看看能否为你完善我的答案。干杯!