实时检测音频流的语音部分的简单方法是什么?我已经开始讨论使用MFCC,FFT等等。但我无法找到任何明确的解释,如何做到这一点。
此外,是否有任何PC程序可以分析wav文件并检测其中存在的人类语音?
答案 0 :(得分:2)
这个话题太复杂了......;没有简单的解决方案或明确的解释;有许多现有的技术和算法。现代技术涉及人工智能和机器学习算法,不仅包括FFT或倒谱分析等简单的DSP算法。但是,您可以尝试使用Java编写的Sphinx-4,以便它自然是跨平台的。
http://cmusphinx.sourceforge.net/sphinx4/
我没有尝试过,所以我无法说出它的可用性,但请确保最好的算法是专利的,真的非常昂贵......