我遇到了特征提取(或特征向量构造)的问题。在分类问题(例如,数字分类)中,通常我们得到具有相同大小或非常相似缩放因子的图像。例如,我们有像这样的28x28像素的图像:
然后,为了提取特征,我们可以对这些图像运行一些过滤,或者将图像重塑为具有相同大小的特征向量28x28x1 = 784x1。
然而,如果我们有一些图像具有完全不同的大小或图像比例因子。我们如何生成一个特征向量来提供进一步的分类算法?例如:
那么我们如何为这些数字(即具有不同比例的图像块)生成统一大小的特征向量?
数字分类只是一个简单的例子,可能是对一个图像进行下采样或对另一个图像进行上采样可以解决问题。但如果这些是更复杂的自然图像我们该怎么办?
另一个问题可能更典型,例如,我们使用一些超像素算法对图像进行了过度分割,如下所示:
我们希望将每个分段超像素(不规则图像块)分类为墙,天空,屋顶等。因为这些图像块是不规则的,我们如何从这些中生成统一大小的特征向量?
一种显而易见的方法似乎是做零填充。但是,我不太确定如何正确地做到这一点。例如,我们是否应始终将图像数据放在矢量的中心或矢量的开头(见下文)?
我们应该这样做吗? [0 0 0 5 6 2 1 2 4 5 6 0 0 0]; [0 0 0 0 0 2 4 5 6 0 0 0 0 0];
或
[5 6 2 1 2 4 5 6 0 0 0 0 0 0]; [2 4 5 6 0 0 0 0 0 0 0 0 0 0];
非零值是实际图像像素数据。这会影响最终的分类吗?
更复杂的情况是不规则超像素具有不同的缩放因子,那么我们如何才能生成特征向量?
非常感谢。
一个。