应用错误收集

时间：2015-12-18 14:06:53

标签： signal-processing speech-recognition

如几本书所述，识别孤立词语的过程包括以下内容：

由于语音信号具有不同的持续时间，因此它们的长度通过动态时间扭曲（DTW）技术对齐，因此所有模板的N都相同。它可以在培训期间完成。

我的问题是：如何改变测试信号的长度？我不能在它上面使用DTW，因为我不知道它属于哪个类。我应该使用“时间拉伸”算法，保留音高，如果我应该，这将如何影响识别准确度？

答案 0 :(得分：0)

你可以得到一个等效的MxN特征向量，用于＆＃34;时间延长＆＃34;信号通过提取特征与N帧在时间上更紧密地隔开或更远。