我对JPEG解码器的基础2-D IDCT如何工作有很好的直觉,特别是在http://en.wikipedia.org/wiki/Discrete_cosine_transform底部看到动画之后。
我也明白它可以简单地表达为:
但是,我不确定我是否理解前方DCT背后的直觉。它也表达为:
但由于某种原因s(x,y,u,v) = r(x,y,u,v)
。为什么?
此外,我对s
的直觉是:每个T(u,v)都是小的8X8图像,其中T(0,0)是平滑的,t(8,8)是棋盘格。像素F(3,7)
的值是这些图像中的每一个中的(3,7)
的每个值的线性组合。 s(3,7,u,v)
表示每张图片中的此值。
因此,例如,我可以假设s(3,7,u,v)
对于(3,7)
更接近白色(255)的小图像是正的,而对于它是暗的(0)则是负的。
这是一个很好的直觉吗?你能为r
提供类似的非数学直觉吗?
谢谢!