连续语音重新定位终点检测

时间:2015-08-28 08:59:08

标签: algorithm matlab speech-recognition endpoint

有人知道连续语音中终点检测的算法吗?因为我找不到一个,现有的算法是针对孤立的单词,而不是连续的,plis帮助。如果可能matlab源代码会有帮助

这是我的算法

success : function(data){
  var json = $.parseJSON(data);
  console.log(json);
}

1 个答案:

答案 0 :(得分:0)

第一个循环可以完全省略:

packages-5.2.0.json

这将输出与您在上面定义的[row,col,val] = find(spektral>0.025); 相同的val。根据{{​​1}}的大小,yspektral将包含您的row。如果col是列向量,则为index1,如果spektral是行向量,则为row

您可以省略第二个循环:

spektral

请注意,col必须是[row,col,val] = find(index1(2:end,:)>index1(1:end-1,:)+1); index1作为第一个find命令的输出。

如果我理解正确,您希望将光谱能量低于阈值视为噪声,并希望将此光谱能量超过阈值的四秒以上将其归类为安静。在那种情况下:

row

在这里,我总是很难找到一个简短的矢量化方法来检查列中的后续数量,我会在找到解决方案时添加它。

您可以使用嵌套的while循环执行此操作,但必然会采用矢量化方式:

col