我有一个.csv文件'Data.csv',并希望使用pandas将其导入Python3.6。我想通过过滤多个列来分析这些数据,并使用我分析的数据将结果保存到新的.csv文件中。我的'Data.csv'用','分隔,并与loc一起使用来过滤我的列。如果导入的文件是逗号分隔的,我是否可以通过选项卡“\ t”将其更改为新的“已过滤”的.csv文件?
(运行Python 3.6)
import pandas as pd
import numpy as np
df = pd.read_csv('Data.csv', sep = ',')
df1 = df.loc[:, ['STATION',"NAME","DATE","AWND","SNOW"]]
df1["DATE"] = pd.to_datetime(df1.DATE)
df1.to_csv('filteredData.csv', sep=',', header=True)
从这里开始,我的新.csv文件包含我想要的列和我的所有数据行。我想计算每个月的平均值,并按年(2016年和2017年)再生成两个.csv文件。
df2 = df1.groupby(pd.Grouper(key='DATE', freq="M")).mean()
如果我理解正确,这会将我的数据按每个月的平均值进行分组。如何进一步将每年(2016年和2017年)分成自己的.csv文件,并将结果显示为:NAME,Month和Average?
感谢您的帮助!