应用错误收集

时间：2012-03-05 10:28:31

标签： c# voice-recognition

我想录制某人的声音，然后根据我得到的关于他/她声音的信息，我知道该人是否再次说话！问题是我没有关于什么统计数据（如频率）导致与人类语音不同的信息，如果有人可以帮助我如何识别某人的声音？

在我研究的时候，我找到了各种关于语音识别的图书馆，但他们无法帮助我，因为我的问题非常简单！我只想表达那个不说话的人。

答案 0 :(得分：3)

你描述的问题并不简单，因为同一个人的声音可能听起来不同（例如，如果这个人感冒等）和/或这个人的说话声音更大/更快/更慢等等。

另一点是与其他声音（背景，其他声音等）的分离。

录制声音的设备质量非常重要 - 有些系统使用多个麦克风来取得良好效果......

总而言之，这不是一件容易的事 - 尤其是如果你想达到一个很好的检测率。

基本上实现这个的方法是：

答案 1 :(得分：3)

请参阅适用于Linux的VoiceID。它使用Sphinx和其他库并很容易安装。

答案 2 :(得分：2)

这里有一些帮助，可能：http://www.generation5.org/content/2004/noReco.asp 基于开源FFT库（http://www.exocortex.org/dsp/），以及有关如何进行说话人验证的一些建议。