我有一个类型为string的class-ish pandas数据框列,如:
MY_CATEGORY
X
X
Y
Z
Z
我想成功:
X Y Z
1 0 0
1 0 0
0 1 0
0 0 1
0 0 1
我该怎么做?
答案 0 :(得分:1)
您可以使用pd.get_dummies
。
import pandas
# your data
# ====================================
df = pd.read_clipboard()
df
MY_CATEGORY
0 X
1 X
2 Y
3 Z
4 Z
# processing
# ====================================
pd.get_dummies(df.MY_CATEGORY)
X Y Z
0 1 0 0
1 1 0 0
2 0 1 0
3 0 0 1
4 0 0 1