如何使用Octave标准化图像?

时间:2012-12-18 11:49:36

标签: algorithm image-processing machine-learning octave face-detection

在他们描述Viola-Jones object detection framework(Viola和Jones的强大实时人脸检测)的论文中,有人说:

  

用于训练的所有示例子窗口都是归一化的方差,以最小化不同光照条件的影响。

我的问题是“如何在Octave中实现图像规范化?”

我不是在寻找Viola& amp;琼斯使用但是产生几乎相同输出的类似产品。我一直在关注很多haar-training教程(尝试检测一只手),但还不能输出一个好的探测器(xml)。

我尝试过与作者联系,但仍然没有回复。

1 个答案:

答案 0 :(得分:2)

我已经在this thread的一般指南中回答了问题。

以下是如何在八度音程中进行方法1(标准化为标准正态偏差)(演示随机矩阵A,当然可以应用于任何矩阵,即图像的表示方式):< / p>

>>A = rand(5,5)
A =

   0.078558   0.856690   0.077673   0.038482   0.125593
   0.272183   0.091885   0.495691   0.313981   0.198931
   0.287203   0.779104   0.301254   0.118286   0.252514
   0.508187   0.893055   0.797877   0.668184   0.402121
   0.319055   0.245784   0.324384   0.519099   0.352954

>>s = std(A(:))
s =  0.25628
>>u = mean(A(:))
u =  0.37275
>>A_norn = (A - u) / s
A_norn =

  -1.147939   1.888350  -1.151395  -1.304320  -0.964411
  -0.392411  -1.095939   0.479722  -0.229316  -0.678241
  -0.333804   1.585607  -0.278976  -0.992922  -0.469159
   0.528481   2.030247   1.658861   1.152795   0.114610
  -0.209517  -0.495419  -0.188723   0.571062  -0.077241

在上面你使用:

  • 获取矩阵的标准偏差:s = std(A(:))
  • 获取矩阵的平均值:u = mean(A(:))
  • 然后按照公式A'[i][j] = (A[i][j] - u)/s进行操作 矢量化版本:A_norm = (A - u) / s

使用向量规范化对其进行规范化也很简单:

>>abs = sqrt((A(:))' * (A(:)))
abs =  2.2472
>>A_norm = A / abs
A_norm =

   0.034959   0.381229   0.034565   0.017124   0.055889
   0.121122   0.040889   0.220583   0.139722   0.088525
   0.127806   0.346703   0.134059   0.052637   0.112369
   0.226144   0.397411   0.355057   0.297343   0.178945
   0.141980   0.109375   0.144351   0.231000   0.157065

在abvove:

  • abs是向量的绝对值(其长度),使用向量化乘法计算(A(:)' * A(:)实际为sum(A[i][j]^2)
  • 然后我们用它来规范化矢量,使其长度为1。