我有以下数据:
at_score atp_1 atp_2 atp_3 g_date g_id g_time ht_diff ht_score htp_1 htp_2 htp_3
0 0 6 7 8 11/16/18 1 0 0 0 1 2 3
1 13 6 7 9 11/16/18 1 15 2 15 1 2 3
2 20 7 8 10 11/16/18 1 18 2 22 3 4 5
3 40 7 8 6 11/16/18 1 33 5 45 4 1 2
4 65 8 7 6 11/16/18 1 60 -3 62 1 2 3
5 0 6 7 8 11/20/18 2 0 0 0 1 2 3
6 10 9 7 8 11/20/18 2 7 -4 6 4 2 3
7 26 6 10 7 11/20/18 2 24 -1 25 1 5 4
8 40 9 7 8 11/20/18 2 42 5 45 1 2 5
9 65 6 7 10 11/20/18 2 60 5 70 1 5 2
其中at_score,ht_score是客队和主队在特定日期(g_date),特定游戏(g_id)和特定时间(g_time)的得分。 ht_diff代表主队的得分差异(ht_score-at_score)。最后,对于我来说,最重要的是,atp_1,atp_2,atp_3是当时正在比赛的3个客队。 htp_1,htp_2,htp_3是他们的主队对手。
我要计算的是基于ht_diff,ht_score和at_score在比赛中以及与他们一起比赛的球员时的变化情况下的每个主场和客队球员的方差-协方差矩阵。例如,客队6在g_id 1的前13分钟(此期间ht_diff = 2)和后27分钟(ht_diff = -3)中与玩家7和8一起玩。
最后,我有大约250万个观察值(一次有10个玩家在玩),因此找到一个“容易”的方法来进行计算非常有帮助。