拆分时间序列以查找Pandas中数据框的年度最大值

时间:2015-10-29 08:28:04

标签: python python-2.7 pandas

我有一个时间序列数据集如下,其中第一列是年,第二个月,第三个日期,后续列是时间序列数据集:

1995   1    1     0.0   1.929  23.015   1.429   0.806   0.177   0.027
1995   1    2   0.000   1.097  12.954   0.000   0.196   0.361   0.233
1995   1    3   0.000  11.391   0.228   0.004   2.134  11.190   0.028
1995   1    4   0.504   0.373   0.197   0.333   5.894   0.003   0.098
1995   1    5   0.027  20.957   0.115   0.208   0.000   0.000   0.104
1995   1    6   0.043   9.952   0.042   2.499   1.406   0.000   0.748
....   .    .   .....   .....   .....   .....   .....   .....   .....
2000   12   31  50.98   23.23   98.78   34.23   34.54   45.54   34.21

我用它来阅读:

pd.read_csv('D:/test.csv')

我想读取数据列并从中查找年度最大值。有关如何对数据进行分组或拆分以查找每个变量的年度最大值的任何建议都会有所帮助。

1 个答案:

答案 0 :(得分:1)

IIUC,根据您的样本数据框df,您可以阅读:

df = pd.read_csv('D:/test.csv', header=None)

然后按列0(年)分组并获取每个值的最大值:

g = df.groupby(0).max()

返回:

      1  2      3       4       5      6      7      8      9
0                                                            
1995  1  6  0.504  20.957  23.015  2.499  5.894  11.19  0.748