在他们描述Viola-Jones object detection framework(Viola和Jones的强大实时人脸检测)的论文中,有人说:
用于训练的所有示例子窗口都是归一化的方差,以最小化不同光照条件的影响。
我的问题是“如何在Octave中实现图像规范化?”
我不是在寻找Viola& amp;琼斯使用但是产生几乎相同输出的类似产品。我一直在关注很多haar-training教程(尝试检测一只手),但还不能输出一个好的探测器(xml)。
我尝试过与作者联系,但仍然没有回复。
答案 0 :(得分:2)
我已经在this thread的一般指南中回答了问题。
以下是如何在八度音程中进行方法1(标准化为标准正态偏差)(演示随机矩阵A
,当然可以应用于任何矩阵,即图像的表示方式):< / p>
>>A = rand(5,5)
A =
0.078558 0.856690 0.077673 0.038482 0.125593
0.272183 0.091885 0.495691 0.313981 0.198931
0.287203 0.779104 0.301254 0.118286 0.252514
0.508187 0.893055 0.797877 0.668184 0.402121
0.319055 0.245784 0.324384 0.519099 0.352954
>>s = std(A(:))
s = 0.25628
>>u = mean(A(:))
u = 0.37275
>>A_norn = (A - u) / s
A_norn =
-1.147939 1.888350 -1.151395 -1.304320 -0.964411
-0.392411 -1.095939 0.479722 -0.229316 -0.678241
-0.333804 1.585607 -0.278976 -0.992922 -0.469159
0.528481 2.030247 1.658861 1.152795 0.114610
-0.209517 -0.495419 -0.188723 0.571062 -0.077241
在上面你使用:
s = std(A(:))
u = mean(A(:))
A'[i][j] = (A[i][j] - u)/s
进行操作
矢量化版本:A_norm = (A - u) / s
使用向量规范化对其进行规范化也很简单:
>>abs = sqrt((A(:))' * (A(:)))
abs = 2.2472
>>A_norm = A / abs
A_norm =
0.034959 0.381229 0.034565 0.017124 0.055889
0.121122 0.040889 0.220583 0.139722 0.088525
0.127806 0.346703 0.134059 0.052637 0.112369
0.226144 0.397411 0.355057 0.297343 0.178945
0.141980 0.109375 0.144351 0.231000 0.157065
在abvove:
abs
是向量的绝对值(其长度),使用向量化乘法计算(A(:)' * A(:)
实际为sum(A[i][j]^2)
)