作为学校项目的一部分,我不得不阅读Steven Lawrence关于使用SOM和CCN来检测面部的论文。对于那些好奇的人,请参阅论文:http://clgiles.ist.psu.edu/papers/UMD-CS-TR-3608.face.hybrid.neural.nets.pdf
在论文的第12页,劳伦斯描述了他如何使用SOM来减少面部数据的维度。但是,我不明白这是如何工作的。在这个例子中,Lawrence使用5x5x5 SOM,输入矢量为25D。如果我的理解是正确的,那么当训练过程完成后,你将留下一个25D的载体,附着在网络中的每个神经元上。那么,这是如何减少数据的维度的呢?自组织地图上的缩小尺寸数据究竟在哪里?我已经研究了很多地方,但由于某种原因,我找不到这个问题的答案。由于这个问题一直困扰着我一段时间,如果有人能为我解答,我将不胜感激。
答案 0 :(得分:0)
每个训练集包含10个图像,以5x5网格(这是25D向量)采样,因此每个训练集(面部)可以被视为250D向量。
Pag 2
有40个不同科目的 10 不同图像。
Lawrence使用了每个维度有5个节点的3D som,它符合(5x5x5)125D向量,保留了原始数据的拓扑信息。
Pag 12
SOM将25维输入向量 s 量化为125个拓扑有序值。 SOM的三个维度可以被认为是三个特征
您可能会意识到数据维度已减少2,空间维度减少了5个。
希望这有帮助