如何检测音频文件中的静音?

时间:2009-11-02 01:46:53

标签: audio media

我正在研究在浏览器中编辑.srt(字幕)文件的工具(该工具用于语言注释)。在用于类似目的的桌面工具中,用户可以访问波形,并且可以“看到”信号中的静音位置,从而为转录选择特定的短语。

这样的工具可以在浏览器中构建(使用Web Workers和Canvas,比如说),但是现在做一些信号处理是不可行的,它可以找到那些沉默。

所以,我正在考虑下一个最好的方法:我可以用什么免费工具来生成一个时间戳列表,其中沉默(低于某个给定的阈值)开始和停止?如果我离线生成这样的列表,并将其与音频文件一起上传,那么我至少可以浏览“短语”(定义为非静音时段)。我认为这仍然是获得转录效率的胜利。

Audacity可以做到这一点,但AFAICT,只有你安装了奈奎斯特,这似乎有一些专利问题。

还有其他选择吗?

如果该工具可以处理尽可能多的ogg,mp3和wav文件,那就太好了。

0 个答案:

没有答案