我想创建一个声音识别系统。一旦被训练的系统应该能够识别类似的声音。例如。我有几个声音,如淋浴,冲水马桶,火警。我会将系统安装在一个公寓里并用这些声音训练它。然后系统应该能够识别这些声音,当安装在不同的公寓里,淋浴,冲水马桶和火警的声音有不同的光谱。那可能吗?可以使用哪些技术?我在考虑语音识别技术,如隐马尔可夫模型,神经网络?
答案 0 :(得分:2)
您正在寻找pattern recognition算法。例如,我相信PCA可以是一个解决方案。您首先提取训练样本的频谱签名。然后,PCA会将新声音分类为最接近的已知样本。
答案 1 :(得分:0)
如果您对通过神经网络这样做感兴趣,我建议您先阅读有关神经网络的文献。此外,可以找到一些有关神经网络语音识别的有用说明here
基本上,这是可以通过此链接here
下载的软件的用户指南我自己没有使用过该软件,但我相信他们也提供了源代码。 希望有所帮助。
编辑:还添加了一些来自Code Project的源代码,用于在神经网络上实现反向传播算法。看看here
答案 2 :(得分:0)
FFT是你的朋友。这个article会给你一些曲目。
答案 3 :(得分:0)
除了提到的模式识别/机器学习解决方案之外,你也应该看看Dynamic Time Warping。