我在理解离散余弦变换的输出时遇到了一些麻烦。 背景: 我想通过仅保存DCT的最相关频率来实现简单的音频压缩。为了有点笼统,我会将几个音轨切成固定大小的片段,比如说5秒钟。 然后我会对每个样本进行DCT,找出所有短片段中最重要的频率。
然而这不起作用,这可能是由于我对DCT的误解。例如,参见下面的图片:
第一张图片显示了音频轨道前40秒的DCT(希望它足够长,以便我获得良好的频率组合)。 第二个图像显示前十秒的DCT。 第四个图像显示前40秒反向连接(如abc-> abccba)的DCT 我在2e5处添加了一个垂直标记用于比较。音乐的采样率通常为44.1 khz
所以这是我的问题: