类别数据框的分类系列

时间:2019-09-12 06:57:51

标签: python pandas dataframe categories

我有一系列的分类值:

y = [A , A , B, C]

我想将其转换为数据框,每个类别具有一列,如果存在此类别,则为1:

df = [A B C]
     [1 0 0]
     [1 0 0]
     [0 1 0]
     [0 0 1]

最好的方法是什么?

1 个答案:

答案 0 :(得分:2)

get_dummieslist一起使用:

y = ['A','A','B','C']

df = pd.get_dummies(y)

MultiLabelBinarizer

from sklearn.preprocessing import MultiLabelBinarizer

mlb = MultiLabelBinarizer()
df = pd.DataFrame(mlb.fit_transform(y),columns=mlb.classes_)
print (df)
   A  B  C
0  1  0  0
1  1  0  0
2  0  1  0
3  0  0  1