我有一个网球比赛列表,其中包括时间,球场,表面,赢家/输家等级,赢家/输家赢得等等信息。我计划用这些信息训练一个MLP网络(使用PyBrain)和地图它是一个输出 - 如果第一个玩家是赢家,则为1.0,否则为0.0。目标是预测未来的匹配(其中一些输入将是未定义的)。
每个玩家都由一个整数标识。有超过100名球员。我想知道我是否能用这些整数直接表示玩家,如果我应该使用小数(即除以100)或者我应该使用二进制表示?这有关系吗?
答案 0 :(得分:1)
我不太确定球员号码的表现方式是否重要。
我假设神经网络将在时间,球场,表面,等级等方面进行训练,而不是在球员数量上进行训练,因此球员ID可能与算法无关。
听起来你有一个包含玩家及其历史表现和排名的数据结构,以及比赛的时间表。因此,播放器和时间表信息很可能作为神经网络的参数输入,但播放器ID将是一个控制评估过程的外部参数。如果这是真的,那么实现方式取决于您的评估算法,而不是神经网络。