我想创建一个带有"三(2D)矩阵的神经网络"作为输入,
输出是1(2D)矩阵,因此三个输入是:
1-2D Matrix包含来自设备的(X,Y)坐标
2-2D矩阵包含来自另一个不同设备的(X,Y)坐标
3-2D矩阵包含我已经
的真实(X,Y)坐标测量它(我不知道确切的包含来自输入还是什么??)
***请注意,每个输入都有自己的错误,我想制作神经网络
最小化该错误并选择最佳结果取决于真实的精确(X,Y)***
**请注意:我正在处理提取(x,y)坐标
的对象跟踪 来自相机的和其他设备的数据相同,例如
我将按照以下方式模拟坐标:
{(1,2),(1,3),(1,4),(1,5),(1,6).......}
等等
当然输出是一个2D矩阵最好或真实精确(x,y),所以我是
初学者,我想了解如何使用此不同的
创建此网络输入并选择最佳训练方法以获得最佳成绩......?!
先谢谢
答案 0 :(得分:1)
听起来你想要的是一个HxWx2输入,其中第一个通道(深度层)是你的第一个输入而第二个通道是你的第二个输入。你的确实准确"坐标将是您的净输出与之比较的目标,而不是输入。
请注意,神经网络并不能很好地处理回归(实值输出) - 您可以获得更好的结果,将坐标范围划分为桶,然后将其视为分类问题(使用softmax loss vs regression)均方误差损失)。
扩展回归与分类点:
回归问题是您希望网络输出实际值,例如0-100范围内的坐标值。分类问题是您希望网络输出一组可选项,您的输入属于它所训练的给定类(例如,您在属于类的图像上训练网络" cat"&#34 ;狗"和"兔子")。
事实证明,现代神经网络在分类方面比回归方法要好得多,因为它们的工作方式基本上是将N维输入空间细分为与他们正在训练的输出相对应的子区域。他们自然要做的就是分类。
将回归问题转化为可能更好的分类问题的显而易见的方法是将您想要的输出范围划分为您视为类的子范围(也称为存储桶)。例如而不是训练您的网络输出0-100范围内的单个(或多个)值,而是将其训练为输出类概率,例如,表示10个独立子范围(类)0-9,10-19中的每一个, 20-20等。