使用列名作为pandas中的新属性

时间:2017-08-15 18:57:05

标签: python pandas reshape

我有以下数据结构

Date         Agric  Food 
01/01/1990    1.3   0.9  
01/02/1990    1.2   0.9 

我想将其转换为格式

Date        Sector  Beta
01/01/1990  Agric   1.3
01/02/1990  Agric   1.2
01/01/1990  Food    0.9
01/02/1990  Food    0.9

虽然我确信我可以用复杂的方式做到这一点,有没有办法在几行代码中执行此操作?

3 个答案:

答案 0 :(得分:5)

使用set_indexstack

df.set_index('Date').rename_axis('Sector',axis=1).stack()\
  .reset_index(name='Beta')

输出:

         Date Sector  Beta
0  01/01/1990  Agric   1.3
1  01/01/1990   Food   0.9
2  01/02/1990  Agric   1.2
3  01/02/1990   Food   0.9

答案 1 :(得分:5)

使用pd.DataFrame.melt

df.melt('Date', var_name='Sector', value_name='Beta')

         Date Sector  Beta
0  01/01/1990  Agric   1.3
1  01/02/1990  Agric   1.2
2  01/01/1990   Food   0.9
3  01/02/1990   Food   0.9

答案 2 :(得分:4)

或者您可以使用lreshape

df=pd.lreshape(df2, {'Date': ["Date","Date"], 'Beta': ['Agric', 'Food']})
df['Sector']=sorted(df2.columns.tolist()[1:3]*2)

   Out[654]: 
         Date  Beta Sector
0  01/01/1990   1.3  Agric
1  01/02/1990   1.2  Agric
2  01/01/1990   0.9   Food
3  01/02/1990   0.9   Food

如果您有48列

df=pd.lreshape(df2, {'Date':['Date']*2, 'Beta': df2.columns.tolist()[1:3]})
df['Sector']=sorted(df2.columns.tolist()[1:3]*2)

对于列Sector,它更安全地创建它

import itertools
list(itertools.chain.from_iterable(itertools.repeat(x, 2) for x in df2.columns.tolist()[1:3]))

编辑原因lreshap未记录(根据@ Ted Petrou 如果可能,最好使用可用的DataFrame方法,如果没有可用的话,请使用记录的函数.pandas一直在寻找改进它的API并调用未记录的,旧的和实验性的函数,比如lreshape的任何东西都是没有根据的。此外,这个问题对于融合或堆栈来说是一个非常直接的用例。对于那些新的pandas设置为Stack Overflow是一个不好的先例。并使用lreshape找到赞成的答案。

此外,如果您想了解更多相关信息,可以在github

查看

以下是使用pd.wide_to_long

的方法
dict1 = {'Agric':'A_Agric','Food':'A_Food'}
df2 = df.rename(columns=dict1)
pd.wide_to_long(df2.reset_index(),['A'],i='Date',j='Sector',sep='_',suffix='.').reset_index().drop('index',axis=1).rename(columns={'A':'Beta '})

Out[2149]: 
         Date Sector  Beta 
0  01/01/1990  Agric    1.3
1  01/02/1990  Agric    1.2
2  01/01/1990   Food    0.9
3  01/02/1990   Food    0.9