月份的日数

时间:2015-03-02 21:09:05

标签: python pandas

我有一个带有日期时间索引的数据框,我想将一些列乘以该月的天数。

                   TUFNWGTP  TELFS  t070101  t070102  t070103  t070104  
TUDIARYDATE                                                              
2003-01-03   8155462.672158      2        0        0        0        0   
2003-01-04   1735322.527819      1        0        0        0        0   
2003-01-04   3830527.482672      2       60        0        0        0   
2003-01-02   6622022.995205      4        0        0        0        0   
2003-01-09   3068387.344956      1        0        0        0        0 

在这里,我想将所有以t开头的列与31相乘。即,预期输出为

                   TUFNWGTP  TELFS  t070101  t070102  t070103  t070104  
TUDIARYDATE                                                              
2003-01-03   8155462.672158      2        0        0        0        0   
2003-01-04   1735322.527819      1        0        0        0        0   
2003-01-04   3830527.482672      2     1680        0        0        0   
2003-01-02   6622022.995205      4        0        0        0        0   
2003-01-09   3068387.344956      1        0        0        0        0 

我知道有一些使用calendar或类似的方式,但鉴于我已经在使用pandas,必须有一种更简单的方法 - 我认为。

没有这样的datetime属性,但有一个offset M - 但我不知道如何在没有大量低效率的情况下使用它。

4 个答案:

答案 0 :(得分:4)

日期时间系列现在有Series.dt.daysinmonth属性。这是一个基于杰夫答案的例子。

In [3]: df = pd.DataFrame({'date' : pd.date_range('20120101',periods=15,freq='M') })

In [4]: df['year'] = df['date'].dt.year

In [5]: df['month'] = df['date'].dt.month

In [6]: df['days_in_month'] = df['date'].dt.daysinmonth

In [7]: df
Out[7]:
         date  year  month  days_in_month
0  2012-01-31  2012      1             31
1  2012-02-29  2012      2             29
2  2012-03-31  2012      3             31
3  2012-04-30  2012      4             30
4  2012-05-31  2012      5             31
5  2012-06-30  2012      6             30
6  2012-07-31  2012      7             31
7  2012-08-31  2012      8             31
8  2012-09-30  2012      9             30
9  2012-10-31  2012     10             31
10 2012-11-30  2012     11             30
11 2012-12-31  2012     12             31
12 2013-01-31  2013      1             31
13 2013-02-28  2013      2             28
14 2013-03-31  2013      3             31

答案 1 :(得分:3)

pd.tslib.monthrange是一个未公开/未记录的函数,用于处理days_in_month计算(调整闰年)。这可能/应该作为属性添加到Timestamp/DatetimeIndex

In [34]: df = DataFrame({'date' : pd.date_range('20120101',periods=15,freq='M') })

In [35]: df['year'] = df['date'].dt.year

In [36]: df['month'] = df['date'].dt.month

In [37]: df['days_in_month'] = df.apply(lambda x: pd.tslib.monthrange(x['year'],x['month'])[1], axis=1)

In [38]: df
Out[38]: 
         date  year  month  days_in_month
0  2012-01-31  2012      1             31
1  2012-02-29  2012      2             29
2  2012-03-31  2012      3             31
3  2012-04-30  2012      4             30
4  2012-05-31  2012      5             31
5  2012-06-30  2012      6             30
6  2012-07-31  2012      7             31
7  2012-08-31  2012      8             31
8  2012-09-30  2012      9             30
9  2012-10-31  2012     10             31
10 2012-11-30  2012     11             30
11 2012-12-31  2012     12             31
12 2013-01-31  2013      1             31
13 2013-02-28  2013      2             28
14 2013-03-31  2013      3             31

答案 2 :(得分:0)

这是一个笨重的手工制作方法来获取一个月的天数

import datetime

def days_in_month(dt):
  next_month = datetime.datetime(
      dt.year + dt.month / 12, dt.month % 12 + 1, 1)
  start_month = datetime.datetime(dt.year, dt.month, 1)
  td = next_month - start_month
  return td.days

例如:

>>> days_in_month(datetime.datetime.strptime('2013-12-12', '%Y-%m-%d'))
31
>>> days_in_month(datetime.datetime.strptime('2013-02-12', '%Y-%m-%d'))
28
>>> days_in_month(datetime.datetime.strptime('2012-02-12', '%Y-%m-%d'))
29
>>> days_in_month(datetime.datetime.strptime('2012-01-12', '%Y-%m-%d'))
31
>>> days_in_month(datetime.datetime.strptime('2013-11-12', '%Y-%m-%d'))
30

我让你弄清楚如何阅读你的表并自己进行乘法运算:)

答案 3 :(得分:0)

import pandas as pd
from pandas.tseries.offsets import MonthEnd

df['dim'] = (pd.to_datetime(df.index) + MonthEnd(0)).dt.day

如果您的索引已经是pd.to_datetime(),则可以省略DatetimeIndex