Pandas DataFrame:如何将二进制列转换为一个分类列?

时间:2017-04-12 23:55:34

标签: python pandas dataframe binary dummy-variable

给定一个pandas DataFrame,如何将多个二进制列(其中1表示存在的值,0表示它没有)转换为单个分类列?

另一种思考方式是如何执行"反向pd.get_dummies()"?

以下是将分类列转换为多个二进制列的示例:

import pandas as pd
s = pd.Series(list('ABCDAB'))
df = pd.get_dummies(s)
df
   A  B  C  D
0  1  0  0  0
1  0  1  0  0
2  0  0  1  0
3  0  0  0  1
4  1  0  0  0
5  0  1  0  0

我想要完成的是数据框

df1
   A  B  C  D
0  1  0  0  0
1  0  1  0  0
2  0  0  1  0
3  0  0  0  1
4  1  0  0  0
5  0  1  0  0

可以将其转换为

df1
   A  B  C  D   category
0  1  0  0  0   A
1  0  1  0  0   B
2  0  0  1  0   C
3  0  0  0  1   D
4  1  0  0  0   A
5  0  1  0  0   B

1 个答案:

答案 0 :(得分:4)

一种方法是使用idxmax查找1:

In [32]: df["category"] = df.idxmax(axis=1)

In [33]: df
Out[33]: 
   A  B  C  D category
0  1  0  0  0        A
1  0  1  0  0        B
2  0  0  1  0        C
3  0  0  0  1        D
4  1  0  0  0        A
5  0  1  0  0        B