当pandas列中不存在某些类别时获取虚拟对象

时间:2018-01-30 18:28:24

标签: python pandas dataframe data-science data-processing

说我有一个pandas专栏,如下所示

类型
TYPE1
TYPE2
type3

现在我将按照以下方式将上面的假人拿走:
type_dummies = pd.get_dummies(["Type"], prefix="type")

然后在将其与主DataFrame联接之后,生成的df将如下所示:

df.drop(['Type'], axis=1, inplace=True)
df = df.join(type_dummies)
df.head()

type_type1    type_type2    type_type3
   1              0             0
   0              1             0
   0              0             1

但是,如果在我的训练集中type4列中有另一个类别为Type,那该怎么办?那么我如何使用get_dummies()方法尽可能多地生成假人。也就是说,在这种情况下,我想生成4个虚拟变量,尽管在所需的列中只有3个类别?

1 个答案:

答案 0 :(得分:4)

您可以使用nil数据类型

categroy