将大熊猫的年值扩展为月

时间:2019-10-15 07:07:53

标签: pandas reshape

我按年销售:

pd.DataFrame({'year':[2015,2016,2017],'value':['12','24','30']})
    year    value
0   2015    12
1   2016    24
2   2017    36

我想推断到几个月:

yyyymm value
201501 1 (ie 12/12, etc)
201502 1
...
201512 1
201601 2
...
201712 3

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

一个想法是将交叉链接与帮助器DataFrame一起使用,将列转换为字符串,并通过Series.str.zfill添加0

df1 = pd.DataFrame({'m': range(1, 13), 'a' : 1})

df = df.assign(a = 1).merge(df1).drop('a', 1)
df['year'] = df['year'].astype(str) + df.pop('m').astype(str).str.zfill(2)
df = df.rename(columns={'year':'yyyymm'})

另一种解决方案是创建MultiIndex并使用DataFrame.reindex

mux = pd.MultiIndex.from_product([df['year'], range(1, 13)], names=['yyyymm','m'])
df = df.set_index('year').reindex(mux, level=0).reset_index()
df['yyyymm'] = df['yyyymm'].astype(str) + df.pop('m').astype(str).str.zfill(2)

print (df.head(15))
    yyyymm value
0   201501    12
1   201502    12
2   201503    12
3   201504    12
4   201505    12
5   201506    12
6   201507    12
7   201508    12
8   201509    12
9   201510    12
10  201511    12
11  201512    12
12  201601    24
13  201602    24
14  201603    24