如何从连续变量中制作假人

时间:2017-11-11 00:17:27

标签: pandas dummy-variable

我对编程很新,我无法在任何地方找到它。基本上,我的一个变量的范围是0到200000,我试图使用pd.get_dummies为0和> 0值创建一个虚拟对象,但是我无法弄清楚如何,任何人都可以帮助我有这个吗?谢谢!

1 个答案:

答案 0 :(得分:2)

考虑df

df = pd.DataFrame(dict(OneVar=[0, 1, 0, 3, 0, 5, 6, 0, 0, 9]))

在布尔系列

上使用pd.get_dummies
pd.get_dummies(df.OneVar.gt(0))

   False  True 
0      1      0
1      0      1
2      1      0
3      0      1
4      1      0
5      0      1
6      0      1
7      1      0
8      1      0
9      0      1

使用重命名的列

pd.get_dummies(df.OneVar.gt(0)).rename(
    columns=dict(enumerate(['IsZero', 'GtZero'])))

   IsZero  GtZero
0       1       0
1       0       1
2       1       0
3       0       1
4       1       0
5       0       1
6       0       1
7       1       0
8       1       0
9       0       1