Pandas.get_dummies()单列编码

时间:2018-07-24 15:24:02

标签: python pandas

使用Pandas,并且我想在正在使用的数据帧上生成虚拟变量,但是它总是为二进制值生成两列。如何防止它分裂成列?

例如:data = pd.get_dummies(data, columns=['gender'])将在“性别”字段的位置生成两列。 (即gender_malegender_female,带有1的数字表示该列的记录的值何时为真。)

我认为这是多余的,但是我不确定这是否重要。

我想知道的是如何强制或强制get_dummies()函数生成一个单独的列,其中1 == 'Male'0 == 'Female'

最常见/推荐的过程是什么?

0 个答案:

没有答案