传递的值的形状为(1,32561),索引暗含(2,32561)

时间:2019-05-02 20:43:20

标签: pandas join

在LabelBinariring Sex列之后,我尝试将新的列加入pandas。 df["sex"].value_counts()返回

 Male      21790
 Female    10771
Name: sex, dtype: int64

但是当我执行此操作

    from sklearn.preprocessing import LabelBinarizer
    binarize=LabelBinarizer()
    data_o=df.join(pd.DataFrame(binarize.fit_transform(data["sex"]),
columns=binarize.classes_,index=data.index))

我收到错误

Shape of passed values is (1, 32561), indices imply (2, 32561

但性别栏由男性和女性两种类型组成。我怎样才能解决这个问题。请帮助

1 个答案:

答案 0 :(得分:0)

你能做

binarize.fit_transform(data["sex"]).shape
len(binarize.classes_)

看看输出是什么?