我无法解释它。这是段落(最后两行对我的问题很重要)。
我们探索的最简单的模型是直接回归 原始RGB-D图像来掌握坐标。原始图像是 给予使用卷积层提取的模型 图像的功能。完全连接的层终止 在输出层有六个输出神经元对应的 掌握的坐标。四个神经元对应 到位置和高度。 抓握角度是旋转的两倍 对称所以我们通过使用两个附加参数化 坐标:角度的两倍的正弦和余弦。
粗线意味着什么?
更详细,
首先,为什么角度的两倍?
第二:什么是双重旋转对称?
第三:为什么我不能直接回归角度?此段落来自paper - 第2页,右栏,B部分。
答案 0 :(得分:0)
第二个问题在这里得到解答:http://mathstat.slu.edu/escher/index.php/Rotational_Symmetry并且据我所知,这意味着在360度圆圈内,对象可以旋转两次并且在视觉上看起来相同。由于纸张的主题是机器人视觉,旋转45度的抓握矩形与旋转(180 + 45)度的矩形相同。
第一和第三个问题:本文中提到的神经网络似乎可以直接使用角度作为输入。由于旋转对称,机器人视觉只能解决抓握矩形的180度旋转,并且对于神经网络的神经元输入范围,将正弦和余弦输出增加到完整的360度,检测到的视觉旋转角度加倍作为形式数据调节。