所以我在这个表单上有一个名为year的pandas数据框:
discharge (m^3/s)
date
2016-01-01 00:00:00 17.6930
2016-01-01 01:00:00 17.3247
2016-01-01 02:00:00 17.2436
2016-01-01 03:00:00 17.5696
2016-01-01 04:00:00 16.4074
2016-01-01 05:00:00 17.5696
2016-01-01 06:00:00 17.0420
....
2017-12-31 20:00:00 10.5911
2017-12-31 21:00:00 10.5620
2017-12-31 22:00:00 10.7374
2017-12-31 23:00:00 10.5620
数据集包含了几年的排放数据,我想做一个比较f.ex的情节。 2016年1月和2017年的月份。
到目前为止,我的尝试是提取所需的月份,并将它们绘制在彼此之上。但是这不起作用,如图所示:
我的代码是:
# Comparison full months
def plotmonthdischarge(month, years, number_of_years):
df = pd.read_csv('resources\FinVannføringEidsfjordvatn.csv', encoding = 'ISO-8859-1',sep=';')
df['date'] = pd.to_datetime(df['date'],dayfirst=True)
df = df.set_index(df['date'])
df['Day Of Year'] = df['date'].dt.dayofyear
df = df.drop(['date'], axis = 1)
df = df.replace(to_replace='-9999', value = np.NaN)
fig, ax = plt.subplots()
# For a starting year 2016 and a 1 following year
# Call example:
# plotmonthdischarge(1,[2016],2)
if len(years) == 1:
start_year = years[0]
for i in range(number_of_years):
year = df['{0}-{1}-01 00:00:00'.format(start_year+i,month):'{0}-{1}-31 23:59:59'.format(start_year+i,month)]
ax.plot(year['discharge (m^3/s)'], label = 'Year {}'.format(start_year+i))
# Just for plotting(ignore)
formatted_list = ['{:>3}' for i in range(number_of_years)]
string_of_years = ', '.join(formatted_list).format(*[start_year+i for i in range(number_of_years)])
plt.title('Comparison plot of years {}'.format(string_of_years))
# Specific years 2006 and 2017
# Call example:
# plotmonthdischarge(1,[2006,2017],1)
if len(years) > 1:
number_of_years = 1
for item in years:
year = df['{0}-{1}-01 00:00:00'.format(item,month):'{0}-{1}-31 23:59:59'.format(item,month)]
ax.plot(year['Day Of Year'],year['discharge (m^3/s)'], label = 'Year {}'.format(item))
# Just for plotting(ignore)
formatted_list = ['{:>3}' for item in years]
string_of_years = ', '.join(formatted_list).format(*years)
plt.title('Comparison plot of years {}'.format(string_of_years))
print(year)
plt.suptitle(r'Discharge $m^{3}s^{-1}$')
plt.ylabel(r'Discharge $m^{3}s^{-1}$')
plt.legend()
plt.grid(True)
plotmonthdischarge(1,[2015,2016],1)
我的下一次尝试是我在其他帖子中找到的东西
df['Day Of Year'] = df['date'].dt.dayofyear
然后绘制本月所有日子:
ax.plot(year['Day Of Year'],year['discharge (m^3/s)'], label = 'Year {}'.format(item))
这个工作没问题,但似乎每天只有一个左右的点被注册,这是因为我正在使用每小时数据。
还尝试从datetime(我的索引)中删除年份,并仅使用月,日和小时绘制日期时间索引,但没有取得真正的成功。
修改:
一年(2015年,1月)的情节如何显示的示例图。
答案 0 :(得分:1)
如果您的数据没有缺失值(NaN
),我建议使用.loc
将所需年份从DataFrame中分割出来,并使用.values
绘制基础numpy数组:
fig, ax = plt.subplots()
for yr in ['2016', '2017']:
ax.plot(df.loc[yr].values, label = 'Year {}'.format(yr))
更灵活的方法是手动计算年份的小时,而不是一年中的某一天,然后从那里开始:
df['hourofyear'] = 24 * (df.index.dayofyear - 1) + df.index.hour
fig, ax = plt.subplots()
for yr, g in df.groupby(df.index.year):
g.plot('hourofyear', 'discharge (m^3/s)', label='Year {}'.format(yr), ax=ax)