我很好奇“框架阻挡”,这是我在网站上看到的第一步。它说这些步骤应该遵循音频的特征提取:
“帧阻挡”是什么意思?任何人都可以为此提供算法或代码(c#)吗?
顺便说一下,这个特征提取的步骤是否正确?
在提取特征之前,我应该怎么做“预过滤”aduio?
感谢。
答案 0 :(得分:2)
以下是我在谷歌搜索中发现的术语“框架阻止” - 谷歌自动完成“框架阻止语音信号”。
相关文字:
语音信号处理中最常用的方法是基于短时分析。预先聚集的信号被阻挡成 N 样本的帧。帧持续时间通常在10-30mxec之间。该范围内的值表示频谱变化率与系统复杂性之间的折衷。适当的帧持续时间最终取决于语音生成系统中发音器的速度。一些声音(例如,停止辅音)表现出明显的光谱过渡,这可能导致光谱峰值移动多达80 Hz / msec(Mar76)。图2.3说明了一个字对 J 帧的阻塞。重叠量在一定程度上控制参数在帧与帧之间的变化速度。
现在问题是,你在框架拦截方面做了什么尝试?