这是我的数据框:
C
“日期”列包含在“词典”列中找到的键,而“小时”列包含所有值。我想计算每一对“天,小时”组合在整个“词典”栏中出现的频率。例如,以第一行;我想计算“字典”列中2.0是键的次数,而当2.0是键时,11.0是值之一?试图弄清楚如何在Python中做到这一点。
所需的输出将是“日期”和“小时”列相同的数据帧,但最后一列是其出现频率。所需的输出看起来像这样:
Day Hour Dictionary
2.0 11.0 {2: [10, 11, 12, 13]}
5.0 14.0 {6: [4, 5, 6, 7, 8, 9, 10, 11, 12, 13]}
1.0 16.0 {1: [12, 13, 14, 15, 16, 17]}
2.0 13.0 {2: [8, 9, 10, 11, 12, 13, 14, 15, 16]}
5.0 11.0 {5: [12, 12]}
其中“日期和时间”列还原为原始数据帧,并且“频率”列显示“日期”观察值是关键次数,并且“小时”列包含在值中的次数是各自的日子是关键。例如,上面的数据框意味着2.0、11.0是键,值对,它是从第一个数据框起的原始“字典”列中的11倍。