我是使用python的新手,我一直在寻找答案,但没有什么可以帮助我。
我有一个形式为
的pandas数据框数据
输出:
CALL_TYPE TIMESTAMP
0 B 1408039037
1 B 1408038611
2 B 1408038568
3 B 1408039090
4 B 1408039177
5 A 1408037146
6 B 1408038846
7 A 1408038948...
我的 TIMESTAMP 是 pandas.core.series.Series
类型的 int64我想把我的TIMESTAMP的频率计算在" day"和"小时"。
如何使用Python pandas实现这一目标?
提前致谢:)
答案 0 :(得分:0)
首先,将它们分成几小时和几天:
data['DAY'], data['HOUR'] = data["TIMESTAMP"] // (24*3600), data["TIMESTAMP"] % (24*3600)
现在,做点算:
data.groupby(['DAY','HOUR']).count()