有以下格式的数据框(df):
Name, Col-1, Col-2, Col-3, Col-4
abc, 0, 1, 0, 0
cba, 1, 0, 0, 0
bns 1, 0, 0, 0
abd 0 0, 0, 1
现在我正尝试向此数据框添加新列,如下所示:
Name, Col-1, Col-2, Col-3, Col-4, Type
abc, 0, 1, 0, 0, Col-2
cba, 1, 0, 0, 0, Col-1
bns 1, 0, 0, 0, Col-1
abd 0 0, 0, 1, Col-4
请提出如何完成的建议,我在下面尝试过但抛出错误。
df['Type'] = [lambda x: x if x == 1 for x in df.columns]
答案 0 :(得分:2)
您可以使用idxmax:
In [11]: df
Out[11]:
Name Col-1 Col-2 Col-3 Col-4
0 abc 0 1 0 0
1 cba 1 0 0 0
2 bns 1 0 0 0
3 abd 0 0 0 1
In [12]: df.iloc[:, 1:]
Out[12]:
Col-1 Col-2 Col-3 Col-4
0 0 1 0 0
1 1 0 0 0
2 1 0 0 0
3 0 0 0 1
In [13]: df.iloc[:, 1:].idxmax(axis=1)
Out[13]:
0 Col-2
1 Col-1
2 Col-1
3 Col-4
dtype: object
In [14]: df["Type"] = df.iloc[:, 1:].idxmax(axis=1)
In [15]: df
Out[15]:
Name Col-1 Col-2 Col-3 Col-4 Type
0 abc 0 1 0 0 Col-2
1 cba 1 0 0 0 Col-1
2 bns 1 0 0 0 Col-1
3 abd 0 0 0 1 Col-4
答案 1 :(得分:1)
由于互斥可以使用.dot
df['Type'] = df.iloc[:, 1:].dot(df.columns[1:])
Name Col-1 Col-2 Col-3 Col-4 Type
0 abc 0 1 0 0 Col-2
1 cba 1 0 0 0 Col-1
2 bns 1 0 0 0 Col-1
3 abd 0 0 0 1 Col-4