如何了解熊猫的重采样功能在其中起作用了什么?

时间:2013-11-21 01:55:06

标签: python pandas

我使用python模块pandas及其函数resample来计算数据集的均值。我想知道如何才能知道每天/每个月的重新采样是什么。 在下面给出的例子中,我计算了1月,2月和3月三个月的平均值。 在这种情况下,我的问题的答案是:1月份为N = 31,2月份为N = 29,3月份为N = 31.是否有办法获取有关N的信息以获取更复杂的数据?

import pandas as pd
import numpy as np

#create dates as index
dates = pd.date_range('1/1/2000', periods=91)
index = pd.Index(dates, name = 'dates')

#create DataFrame df
df = pd.DataFrame(np.random.randn(91, 1), index, columns=['A'])

print df['A']
#calculate monthly_mean
monthly_mean = df.resample('M', how='mean')

提前致谢。

1 个答案:

答案 0 :(得分:0)

您可以使用how='count',IIUC:

>>> df.resample('M', how='count')
2000-01-31  A    31
2000-02-29  A    29
2000-03-31  A    31
dtype: int64