应用错误收集

“框架阻挡”是什么意思？

时间：2013-03-05 15:07:40

标签： c# speech-recognition naudio audio-processing feature-extraction

我很好奇“框架阻挡”，这是我在网站上看到的第一步。它说这些步骤应该遵循音频的特征提取：

框架拦截
窗口
fft
mel-frequency warping
倒谱

“帧阻挡”是什么意思？任何人都可以为此提供算法或代码（c＃）吗？

顺便说一下，这个特征提取的步骤是否正确？

在提取特征之前，我应该怎么做“预过滤”aduio？

感谢。

1 个答案:

答案 0 :(得分：2)

以下是我在谷歌搜索中发现的术语“框架阻止” - 谷歌自动完成“框架阻止语音信号”。

http://books.google.com/books?id=B9VuCBBYzJ4C&pg=PA21&lpg=PA21&dq=frame+blocking+of+speech+signal&source=bl&ots=FCzp86g8F0&sig=P5aolL4OAAyPwxZ2nMd-Ye_5M_I&hl=en&sa=X&ei=oLM3UeK3DsTfrQHyvYD4DQ&sqi=2&ved=0CC4Q6AEwAA#v=onepage&q=frame%20blocking%20of%20speech%20signal&f=false

相关文字：

语音信号处理中最常用的方法是基于短时分析。预先聚集的信号被阻挡成 N 样本的帧。帧持续时间通常在10-30mxec之间。该范围内的值表示频谱变化率与系统复杂性之间的折衷。适当的帧持续时间最终取决于语音生成系统中发音器的速度。一些声音（例如，停止辅音）表现出明显的光谱过渡，这可能导致光谱峰值移动多达80 Hz / msec（Mar76）。图2.3说明了一个字对 J 帧的阻塞。重叠量在一定程度上控制参数在帧与帧之间的变化速度。

现在问题是，你在框架拦截方面做了什么尝试？