基于其他列值的估算值

时间:2019-04-04 18:54:03

标签: pandas

有以下格式的数据框(df):

Name,   Col-1,  Col-2, Col-3, Col-4
abc,    0,      1,      0,      0
cba,    1,      0,      0,      0
bns     1,      0,      0,      0
abd     0       0,      0,      1

现在我正尝试向此数据框添加新列,如下所示:

Name,   Col-1,  Col-2, Col-3, Col-4,    Type
abc,    0,      1,      0,      0,      Col-2
cba,    1,      0,      0,      0,      Col-1
bns     1,      0,      0,      0,      Col-1
abd     0       0,      0,      1,      Col-4

请提出如何完成的建议,我在下面尝试过但抛出错误。

df['Type'] = [lambda x: x if x == 1 for x in df.columns]

2 个答案:

答案 0 :(得分:2)

您可以使用idxmax

In [11]: df
Out[11]:
  Name  Col-1  Col-2  Col-3  Col-4
0  abc      0      1      0      0
1  cba      1      0      0      0
2  bns      1      0      0      0
3  abd      0      0      0      1

In [12]: df.iloc[:, 1:]
Out[12]:
   Col-1  Col-2  Col-3  Col-4
0      0      1      0      0
1      1      0      0      0
2      1      0      0      0
3      0      0      0      1

In [13]: df.iloc[:, 1:].idxmax(axis=1)
Out[13]:
0    Col-2
1    Col-1
2    Col-1
3    Col-4
dtype: object

In [14]: df["Type"] = df.iloc[:, 1:].idxmax(axis=1)

In [15]: df
Out[15]:
  Name  Col-1  Col-2  Col-3  Col-4   Type
0  abc      0      1      0      0  Col-2
1  cba      1      0      0      0  Col-1
2  bns      1      0      0      0  Col-1
3  abd      0      0      0      1  Col-4

答案 1 :(得分:1)

由于互斥可以使用.dot

df['Type'] = df.iloc[:, 1:].dot(df.columns[1:])

  Name  Col-1  Col-2  Col-3  Col-4   Type
0  abc      0      1      0      0  Col-2
1  cba      1      0      0      0  Col-1
2  bns      1      0      0      0  Col-1
3  abd      0      0      0      1  Col-4