新列,其列名称来自索引pandas的最大列

时间:2014-12-01 00:13:09

标签: python pandas

我想创建一个新列,其列名为索引的最大值。

领带将包括两个列。

                A   B   C   D   
  TRDNumber                 
ALB2008081610   3   1   1   1   
ALB200808167    1   3   4   1   
ALB200808168    3   1   3   1   
ALB200808171    2   2   5   1   
ALB2008081710   1   2   2   5   

期望的输出

                A   B   C   D   Best
  TRDNumber                 
ALB2008081610   3   1   1   1   A
ALB200808167    1   3   4   1   C
ALB200808168    3   1   3   1   A,C
ALB200808171    2   2   5   1   C
ALB2008081710   1   2   2   5   D

我尝试过以下代码

df.groupby(['TRDNumber'])[cols].max()

1 个答案:

答案 0 :(得分:3)

你可以这样做:

>>> f = lambda r: ','.join(df.columns[r])
>>> df.eq(df.max(axis=1), axis=0).apply(f, axis=1)
TRDNumber
ALB2008081610      A
ALB200808167       C
ALB200808168     A,C
ALB200808171       C
ALB2008081710      D
dtype: object
>>> df['best'] = _
>>> df
               A  B  C  D best
TRDNumber                     
ALB2008081610  3  1  1  1    A
ALB200808167   1  3  4  1    C
ALB200808168   3  1  3  1  A,C
ALB200808171   2  2  5  1    C
ALB2008081710  1  2  2  5    D