人的声音识别/识别

时间:2012-03-05 10:28:31

标签: c# voice-recognition

我想录制某人的声音,然后根据我得到的关于他/她声音的信息,我知道该人是否再次说话!问题是我没有关于什么统计数据(如频率)导致与人类语音不同的信息,如果有人可以帮助我如何识别某人的声音?

在我研究的时候,我找到了各种关于语音识别的图书馆,但他们无法帮助我,因为我的问题非常简单!我只想表达那个不说话的人。

3 个答案:

答案 0 :(得分:3)

你描述的问题并不简单,因为同一个人的声音可能听起来不同(例如,如果这个人感冒等)和/或这个人的说话声音更大/更快/更慢等等。

另一点是与其他声音(背景,其他声音等)的分离。

录制声音的设备质量非常重要 - 有些系统使用多个麦克风来取得良好效果......

总而言之,这不是一件容易的事 - 尤其是如果你想达到一个很好的检测率。

基本上实现这个的方法是:

  • 实现强大的声音分离
  • 实现强大的声音/语音模式提取
  • 根据理想的声音设置创建一个包含您想要识别的声音指纹的数据库
  • 定义一个算法,用于比较存储的指纹和提取/规范化的声音/语音模式(可能需要一些“可能相等”的阈值等等。)
  • 优化算法,直到达到可接受的检测率(同时考虑误报率!)

如需了解详情,请参阅http://www.scholarpedia.org/article/Speaker_recognition

答案 1 :(得分:3)

请参阅适用于Linux的VoiceID。它使用Sphinx和其他库并很容易安装。

答案 2 :(得分:2)

这里有一些帮助,可能:http://www.generation5.org/content/2004/noReco.asp 基于开源FFT库(http://www.exocortex.org/dsp/),以及有关如何进行说话人验证的一些建议。