我有一个数据帧(df1),其中包含以下数据:
Column_name Column_value
Id null
ChangeTypeCd null
AdditionalRef null
PolicyNumber 000000836
PolicyNumber 000000938
PolicyNumber 000000842
PolicyVersion 24
PolicyVersion 48
PolicyVersion 8
ProductCd_Desc null
ProductCd_name null
我正在对groupby Column_name进行分组并转置数据:
df2=df1.groupby('Column_name')['Column_value'].apply(lambda df: df.reset_index(drop=True)).unstack().reset_index()
我得到了Nan的额外一列,其column_name已排序:
Column_name 0 1 2 3
AdditionalRef null Nan Nan Nan
ChangeTypeCd null Nan Nan Nan
Id null Nan Nan Nan
PolicyNumber 000000836 000000938 000000842 Nan
PolicyVersion 24 48 8 Nan
ProductCd_Desc null Nan Nan Nan
ProductCd_name null Nan Nan Nan
我不确定为什么要得到索引为3的列。 另外,我希望输出与输入的顺序相同。因为我需要将此数据填充到配置单元表中,所以列的顺序对我来说非常重要。 (在填充到表中之前,我将再次对上述数据进行转置)