在python中将行转换为列

时间:2019-08-14 07:38:57

标签: python pandas dataframe

我有Fila_ID和MIHF_ID以及Total。我需要根据总数将MIHF_ID转换为列。每个Filaa_ID具有多个MIHF_ID。我尝试过使用Pivot,但这并不能进一步帮助我进行群集。我也需要总列。

Sub AddFormula()
Dim Formula As Variant
 With ThisWorkbook.Worksheets("Form Responses 1")
    .Range("CE2").Formula = "=IFERROR(IF(OR((BZ2=""No"", BZ2=""0"")), BZ2, AN2), AN2)"

 End With
End Sub

我已经尝试过使用group by和unstacking,但是后来我无法选择转换后的列。

        FILA_ID  MIHF_ID      Total
0          1514    34338 249525.220
1          1484    34338 240921.760
2          1514    30927 222260.790
3          1484    30929 214958.440
4         10481    34338 209155.460
...         ...      ...        ...
289783    10070   973713      0.000
289784      422   973713      0.000
289785      312    31563      0.000
289786      556   973713      0.000
289787       29   973713      0.000

我希望将Fila_ID和MIHF_ID总计作为列。

1 个答案:

答案 0 :(得分:1)

如果我正确理解了您的问题,是这样的吗?

import pandas as pd
df = pd.DataFrame({"FILA_ID": [1514, 1484, 1514, 1484, 10481],
                   "MIHF_ID":    [34338, 34338, 30927, 30929, 34338],
                   "Total":    [249525.220, 240921.760, 222260.790, 214958.440, 209155.460]})

df_new = pd.DataFrame(df.groupby(['FILA_ID','MIHF_ID'])['Total'].sum().unstack(fill_value=0).stack())
df_new.reset_index(inplace=True)
df_new.rename(columns = {0:'Total'}, inplace=True)
df_new

    FILA_ID MIHF_ID Total
0   1484    30927   0.00
1   1484    30929   214958.44
2   1484    34338   240921.76
3   1514    30927   222260.79
4   1514    30929   0.00
5   1514    34338   249525.22
6   10481   30927   0.00
7   10481   30929   0.00
8   10481   34338   209155.46