我使用python模块pandas
及其函数resample
来计算数据集的均值。我想知道如何才能知道每天/每个月的重新采样是什么。
在下面给出的例子中,我计算了1月,2月和3月三个月的平均值。
在这种情况下,我的问题的答案是:1月份为N = 31,2月份为N = 29,3月份为N = 31.是否有办法获取有关N的信息以获取更复杂的数据?
import pandas as pd
import numpy as np
#create dates as index
dates = pd.date_range('1/1/2000', periods=91)
index = pd.Index(dates, name = 'dates')
#create DataFrame df
df = pd.DataFrame(np.random.randn(91, 1), index, columns=['A'])
print df['A']
#calculate monthly_mean
monthly_mean = df.resample('M', how='mean')
提前致谢。
答案 0 :(得分:0)
您可以使用how='count'
,IIUC:
>>> df.resample('M', how='count')
2000-01-31 A 31
2000-02-29 A 29
2000-03-31 A 31
dtype: int64