我有一些关于视频游戏的数据。
数据:
匹配有一个matchId。每场比赛都包括两支球队,每支球队的球队规模各不相同例如,3v3,4v4,5v5 ......数据简化如下:
matchId playerId teamId victory
100 200 14 1
100 201 14 1
100 212 14 1
100 220 14 1
100 202 15 0
100 206 15 0
100 214 15 0
100 217 15 0
任务:
我喜欢在Scikit中使用二元分类器来根据玩家的特征预测胜利值(0/1)。
问题:
答案 0 :(得分:0)
一种方法是使用所有player_ids multiplied with 2
(2个团队)的稀疏矢量,其中所选择的那些用非零值表示,如<1。
如果有N players 0, ..., N-1
和team A consists of 1, 3, 5
,team B consists of 0, 2, 4
,则输入如下所示:
x_sample_0 = [0, 1, 0, 1, 0, 1, 0, ...N-1, 1, 0, 1, 0, 1, ...]
...team A... ... team B...
这应该是一个非常强大的表示(就所代表的信息而言)两个明显的缺点 :
修改强>
还有一个选择:
f_0 = team of 0, 2, 4
)并使用此表示形式,该表示形式具有不同的矢量大小,具体取决于统计数据