什么是各向异性缩放?它是如何实现图像处理和计算机视觉的?
据我所知,这是维基百科提出的某种形式的non-uniform scaling
,但我仍然无法很好地理解它在应用于图像时的实际意义。最近,一些深度学习架构如R-CNN用于物体检测也使用它,但没有对这个主题有太多了解。
明确解释这个概念的任何例子和视觉插图都会非常好。
答案 0 :(得分:1)
非均匀缩放仅意味着对每个维度应用不同的比例,使其具有各向异性。相反的是各向同性缩放,其中相同的比例应用于每个维度。
在R-CNN的背景下,作者做了一个技巧,使用可变大小的图像与分类网络,他们将任何图像调整为固定大小(我相信它是224x224),这是独立于方面完成的图像的比例。所以说你有一个1280x720的图像,如果它被调整为224x244,那么比例是1280/224和720/224,这显然是不一样的,因此各向异性缩放。