使用Pandas,并且我想在正在使用的数据帧上生成虚拟变量,但是它总是为二进制值生成两列。如何防止它分裂成列?
例如:data = pd.get_dummies(data, columns=['gender'])
将在“性别”字段的位置生成两列。 (即gender_male
和gender_female
,带有1的数字表示该列的记录的值何时为真。)
我认为这是多余的,但是我不确定这是否重要。
我想知道的是如何强制或强制get_dummies()
函数生成一个单独的列,其中1 == 'Male'
和0 == 'Female'
。
最常见/推荐的过程是什么?