我真的不知道怎么说这个问题所以请耐心等待。
假设我正在开发一个神经网络,用于评估田径比赛中的每个跑步者。我给出了关于跑步者的神经网络信息,例如。胜利%,自上次运行以来的日子等等。
我的问题是 - 在这种情况下,神经网络是评级跑步者,我可以给网络一个输入,比如种族天气吗?例如我给网络1.00热,2.00冷,3.00为OK ..?
我问这个问题的原因:神经网络的输出越大,跑步者越好。因此,这意味着赢得%输入越高,评级越大。如果我给出神经网络输入,那么值越大并不一定意味着跑者越好,网络能够理解并使用/解释这个输入吗?
如果问题没有意义,请告诉我!
答案 0 :(得分:2)
神经网络的作用是输入和输出之间的映射关系。这意味着您必须为您的神经网络提供某种目标。这些目标的例子可以是预测胜利者","预测每个跑步者的速度"或者预测比赛的完整结果"。当然,哪些例子对您来说是合理的,取决于您可用的数据。
如果您有一个大型数据集(例如每个跑步者的几百场比赛),其中记录了结果时间和所有预测变量(包括天气),并确定 之间的关系天气和个人跑步者表现神经网络很可能能够映射出这种关系,即使每个跑步者的关系不同。
要记录的好天气变量的示例可以是太阳强度(W / m2),头风(m / s)和温度(deg C)。然后可以使用这些变量对每个跑步者的表现进行建模,然后可以使用神经网络来预测跑步者的表现(观察这种方法每个跑步者需要一个神经网络)。
答案 1 :(得分:2)
神经网络可以正确地模拟不相关的输入(通过赋予它们低权重)和与所需输出成反比的输入(通过赋予负权重)。神经网络使用不断变化的输入做得更好,因此1.00 for hot, 2.00 for cold, 3.00 for OK ..
的示例并不理想:更好的是0.00 for hot, 1.00 for OK, 2.00 for cool
。
在您的国家/地区代码中没有真正连续关系的情况下,最佳编码(从汇聚角度来看)是使用一组布尔属性(isArgentina, isAustralia, ..., isZambia
)。尽管如此,神经网络应该能够模拟离散值的输入(即如果国家是相关的,如果你将它们编码为数字,最终神经网络应该能够收敛于87 (Kenya) is correlated with high performance
)。在这种情况下,可能需要更多隐藏节点或更长的训练期。
神经网络的整个点是在难以进行简单统计分析的情况下使用它们,所以我不同意另一个答案,即你应该预先判断你的数据。