我正在为我的电脑制作语音识别软件,但我遇到了一些问题: 1)有没有办法忽略背景噪音?我希望程序在没有噪音的情况下有x个时间结束但是背景噪音可以让它无限期地保持清醒状态。 2)同样的事情,但反过来,我希望它在听到声音时开始,但是足够大的背景噪音也会启动它。
答案 0 :(得分:0)
抱歉,我无法提供任何代码,只能提供伪代码。您可以创建可用音素的en enum或列表。仅当识别出音素的ADSR模式(以音量作为辅助指示符)时,才能激活程序以分离“背景”音素。如果背景噪音很大,会干扰音素的识别,那么它首先不应被视为背景声音。
Aah = 1
Ahh = 2
Ehh = 3
...
if soundEvent == true:
if phoneme.type = Aah:
what_i_said = "a"
...