说我有一个pandas专栏,如下所示
类型
TYPE1
TYPE2
type3
现在我将按照以下方式将上面的假人拿走:
type_dummies = pd.get_dummies(["Type"], prefix="type")
然后在将其与主DataFrame联接之后,生成的df将如下所示:
df.drop(['Type'], axis=1, inplace=True)
df = df.join(type_dummies)
df.head()
type_type1 type_type2 type_type3
1 0 0
0 1 0
0 0 1
但是,如果在我的训练集中type4
列中有另一个类别为Type
,那该怎么办?那么我如何使用get_dummies()
方法尽可能多地生成假人。也就是说,在这种情况下,我想生成4个虚拟变量,尽管在所需的列中只有3个类别?
答案 0 :(得分:4)
您可以使用nil
数据类型
categroy