我正在绘制20年的气候图,但在求平均值时遇到了问题。 我的数据是1999年12月以来的CSV格式的小时数据。我使用API来获取数据,目前将其保存在熊猫数据框中。我可以像这样分散时间,天数等:
dfROVC1['Month'] = dfROVC1['time'].apply(lambda cell: int(cell[5:7]))
dfROVC1['Day'] = dfROVC1['time'].apply(lambda cell: int(cell[8:9]))
dfROVC1['Year'] = dfROVC1['time'].apply(lambda cell: int(cell[0:4]))
dfROVC1['Hour'] = dfROVC1['time'].apply(lambda cell: int(cell[11:13]))
因此,我平均使用以下各项:
z=dfROVC1.groupby([dfROVC1.index.day,dfROVC1.index.month]).mean()
那行得通,但是我意识到我应该取所有数据的均值和均值的平均值。我一直很难解决所有这些问题。 我希望我的情节看起来像这样: Monthly Average Section 但我不知道如何使它工作。 我目前正在将Jupyter Notebook与Python 3配合使用。 任何帮助将不胜感激。
答案 0 :(得分:0)
您是否有理由不只是使用datetime来转换时间列?
每月的最小值为:
z=dfROVC1.groupby(['Year','Month']).min()