我正在进行多视图人脸检测并遵循琼斯的多视图人脸检测算法。
在论文"Fast Multi-view Face Detection"中,琼斯使用不同面部姿势的图像训练C4.5决策树。在决策树训练的第3.3节中,它被称为"训练算法几乎与增强算法相同。两个主要区别是特征选择的标准和每个节点的训练集的分裂"
我学习并理解了C4.5算法here。
我无法弄清楚如何为C4.5决策树训练不同面部姿势的图像。
编辑1: 训练用于级联分类器的ADABOOST算法的阶段0和阶段1特征如下所示。
<!-- stage 0 -->
<_>
<maxWeakCount>3</maxWeakCount>
<stageThreshold>-0.7520892024040222</stageThreshold>
<weakClassifiers>
<!-- tree 0 -->
<_>
<internalNodes>
0 -1 46 -67130709 -21569 -1426120013 -1275125205 -21585
-16385 587145899 -24005</internalNodes>
<leafValues>
-0.6543210148811340 0.8888888955116272</leafValues></_>
<!-- tree 1 -->
<_>
<internalNodes>
0 -1 13 -163512766 -769593758 -10027009 -262145 -514457854
-193593353 -524289 -1</internalNodes>
<leafValues>
-0.7739216089248657 0.7278633713722229</leafValues></_>
<!-- tree 2 -->
<_>
<internalNodes>
0 -1 2 -363936790 -893203669 -1337948010 -136907894
1088782736 -134217726 -741544961 -1590337</internalNodes>
<leafValues>
-0.7068563103675842 0.6761534214019775</leafValues></_></weakClassifiers></_>
<!-- stage 1 -->
<_>
<maxWeakCount>4</maxWeakCount>
<stageThreshold>-0.4872078299522400</stageThreshold>
<weakClassifiers>
<!-- tree 0 -->
<_>
<internalNodes>
0 -1 84 2147483647 1946124287 -536870913 2147450879
738132490 1061101567 243204619 2147446655</internalNodes>
<leafValues>
-0.8083735704421997 0.7685696482658386</leafValues></_>
<!-- tree 1 -->
<_>
<internalNodes>
0 -1 21 2147483647 263176079 1879048191 254749487 1879048191
-134252545 -268435457 801111999</internalNodes>
<leafValues>
-0.7698410153388977 0.6592915654182434</leafValues></_>
<!-- tree 2 -->
<_>
<internalNodes>
0 -1 106 -98110272 1610939566 -285484400 -850010381
-189334372 -1671954433 -571026695 -262145</internalNodes>
<leafValues>
-0.7506558895111084 0.5444605946540833</leafValues></_>
<!-- tree 3 -->
<_>
<internalNodes>
0 -1 48 -798690576 -131075 1095771153 -237144073 -65569 -1
-216727745 -69206049</internalNodes>
<leafValues>
-0.7775990366935730 0.5465461611747742</leafValues></_></weakClassifiers></_>
EDIT2:
我对如何训练决定的考虑如下图所示
我还在弄清楚要使用的功能有哪些,但我认为培训应该如附图中所示。
感谢
答案 0 :(得分:1)
没有读过这篇论文,但从早期的人脸识别实验中我所知道的,你正在寻找的属性可能只是脸部图像的灰度级输入。通常,图像会重新缩放,例如32x32像素,因此您可以使用1024维度向量来训练决策树。仔细看看文章,如果他们使用其他功能,他们会写,或至少给出参考?