对于我的计算方法(SSA),我有一个相当大的数据框-大约80000行。我想按几行(例如20行)平均我的数据。我该怎么办?
我有一个数据框,例如:
1. 00h 03h 06h 09h 12h
10 0.003546 0.000885 0.006852 0.00171 0.001708
11 0.00667 0.012603 0.012933 0.05603 0.025855
12 0.089116 0.054549 0.022177 0.090342 0.070226
13 0.28974 0.246415 0.297231 0.399953 0.287122
最后,我想要这样的东西:
我该怎么做?
答案 0 :(得分:1)
使用由numpy.arange
和聚合mean
的DataFrame的长度创建的范围来进行整数除法:
df = df.groupby(np.arange(len(df))//2).mean()
print (df)
00h 03h 06h 09h 12h
0 0.005108 0.006744 0.009893 0.028870 0.013782
1 0.189428 0.150482 0.159704 0.245147 0.178674