我有一个时间序列数据集如下,其中第一列是年,第二个月,第三个日期,后续列是时间序列数据集:
1995 1 1 0.0 1.929 23.015 1.429 0.806 0.177 0.027
1995 1 2 0.000 1.097 12.954 0.000 0.196 0.361 0.233
1995 1 3 0.000 11.391 0.228 0.004 2.134 11.190 0.028
1995 1 4 0.504 0.373 0.197 0.333 5.894 0.003 0.098
1995 1 5 0.027 20.957 0.115 0.208 0.000 0.000 0.104
1995 1 6 0.043 9.952 0.042 2.499 1.406 0.000 0.748
.... . . ..... ..... ..... ..... ..... ..... .....
2000 12 31 50.98 23.23 98.78 34.23 34.54 45.54 34.21
我用它来阅读:
pd.read_csv('D:/test.csv')
我想读取数据列并从中查找年度最大值。有关如何对数据进行分组或拆分以查找每个变量的年度最大值的任何建议都会有所帮助。
答案 0 :(得分:1)
IIUC,根据您的样本数据框df
,您可以阅读:
df = pd.read_csv('D:/test.csv', header=None)
然后按列0(年)分组并获取每个值的最大值:
g = df.groupby(0).max()
返回:
1 2 3 4 5 6 7 8 9
0
1995 1 6 0.504 20.957 23.015 2.499 5.894 11.19 0.748