在LabelBinariring Sex列之后,我尝试将新的列加入pandas。 df["sex"].value_counts()
返回
Male 21790
Female 10771
Name: sex, dtype: int64
但是当我执行此操作
from sklearn.preprocessing import LabelBinarizer
binarize=LabelBinarizer()
data_o=df.join(pd.DataFrame(binarize.fit_transform(data["sex"]),
columns=binarize.classes_,index=data.index))
我收到错误
Shape of passed values is (1, 32561), indices imply (2, 32561
)
但性别栏由男性和女性两种类型组成。我怎样才能解决这个问题。请帮助
答案 0 :(得分:0)
你能做
binarize.fit_transform(data["sex"]).shape
len(binarize.classes_)
看看输出是什么?