大熊猫根据其他列的值移动到对应列

时间:2019-12-20 17:02:33

标签: python-3.x pandas pivot-table pandas-groupby

我正在尝试根据f1_ty,f2_ty,f3_ty的值将f1_am,f2_am,f3_am移至对应列

我开始根据_ty中使用集合的唯一值向数据框添加新列,但是我试图弄清楚如何将_am值移至属于它的位置

寻找分组依据和透视的选项,但是结果让我大吃一惊。...

我希望您能提供一些指导。

代码下方。

import pandas as pd 
import numpy as np
data = { 
  'mem_id': ['A', 'B', 'C', 'A', 'B', 'C']
, 'date_inf': ['01/01/2019', '01/01/2019', '01/01/2019', '02/01/2019', '02/01/2019', '02/01/2019'] 
, 'f1_ty': ['ABC', 'ABC', 'ABC', 'ABC', 'GHI', 'GHI'] 
, 'f1_am': [100, 20, 57, 44, 15, 10] 
, 'f2_ty': ['DEF', 'DEF', 'DEF', 'GHI', 'ABC', 'XYZ'] 
, 'f2_am':[20, 30, 45, 66, 14, 21]
, 'f3_ty': ['XYZ', 'GHI', 'OPQ', 'OPQ', 'XYZ', 'DEF'] 
, 'f3_am':[20, 30, 45, 66, 14, 21]
}



df = pd.DataFrame (data) 

#distinct values in columns using sets
distinct_values = sorted(list(set(df['f1_ty'])|set(df['f2_ty'])|set(df['f3_ty'])))


# add distinct values as new columns in the DataFrame
new_df = df.reindex(columns = np.append( df.columns.values, distinct_values))

所以这将是我的出发点和想要的结果。 starting point

enter image description here

1 个答案:

答案 0 :(得分:1)

在这里尝试一下,感谢您遇到的有趣的问题(将colujmns重命名为与wide_to_long()兼容,然后与unstack()兼容,同时dropping附加级别:

m=df.set_index(['mem_id','date_inf']).rename(columns=lambda x: ''.join(x.split('_')[::-1]))
n=(pd.wide_to_long(m.reset_index(),['tyf','amf'],['mem_id','date_inf'],'v')
.droplevel(-1).set_index('tyf',append=True).unstack(fill_value=0).reindex(m.index))

final=n.droplevel(0,axis=1).rename_axis(None,axis=1).reset_index()
print(final)

  mem_id    date_inf  ABC  DEF  GHI  OPQ  XYZ
0      A  01/01/2019  100   20    0    0   20
1      B  01/01/2019   20   30   30    0    0
2      C  01/01/2019   57   45    0   45    0
3      A  02/01/2019   44    0   66   66    0
4      B  02/01/2019   14    0   15    0   14
5      C  02/01/2019    0   21   10    0   21