我想录制某人的声音,然后根据我得到的关于他/她声音的信息,我知道该人是否再次说话!问题是我没有关于什么统计数据(如频率)导致与人类语音不同的信息,如果有人可以帮助我如何识别某人的声音?
在我研究的时候,我找到了各种关于语音识别的图书馆,但他们无法帮助我,因为我的问题非常简单!我只想表达那个不说话的人。
答案 0 :(得分:3)
你描述的问题并不简单,因为同一个人的声音可能听起来不同(例如,如果这个人感冒等)和/或这个人的说话声音更大/更快/更慢等等。
另一点是与其他声音(背景,其他声音等)的分离。
录制声音的设备质量非常重要 - 有些系统使用多个麦克风来取得良好效果......
总而言之,这不是一件容易的事 - 尤其是如果你想达到一个很好的检测率。
基本上实现这个的方法是:
如需了解详情,请参阅http://www.scholarpedia.org/article/Speaker_recognition
答案 1 :(得分:3)
请参阅适用于Linux的VoiceID。它使用Sphinx和其他库并很容易安装。
答案 2 :(得分:2)
这里有一些帮助,可能:http://www.generation5.org/content/2004/noReco.asp 基于开源FFT库(http://www.exocortex.org/dsp/),以及有关如何进行说话人验证的一些建议。