使用深度学习在回归中获得多个输出

时间:2017-12-13 05:17:58

标签: deep-learning regression

给定手的RGB图像和手的关键点的3d位置作为数据集,我想将此作为DL中的回归问题。在这种情况下,输入将是RGB图像,输出应估计关键点的3d位置 我已经看到了一些关于回归的信息,但大多数都试图估计一个单一值。是否可以同时估算多个值(或输出)?

现在我已提到这个code。这家伙正试图估计一个人在图像中的年龄。

1 个答案:

答案 0 :(得分:1)

只要您很好地定义损失函数,来自神经网络的输出向量就可以表示任何内容。假设你要检测10个关键点的(x,y,z)坐标,那么就只有30个元素的长输出矢量说(x1,y1,z1,x2,y2,z2 .......... ....,x10,y10,z10),其中xi,yi,zi表示第i个关键点的坐标,基本上你可以使用任何你觉得方便的顺序。小心你的损失功能。假设您想要计算RMSE损失,您必须正确提取三角形,然后计算每个关键点的RMSE损失,或者如果您熟悉线性代数,只需将其重新整形为3x10矩阵,并将结果也设为3x10矩阵,然后只需使用

loss = tf.sqrt(tf.reduce_mean(tf.squared_difference(Y1, Y2))) 

但是一旦你制定了网络,就必须坚持下去。