我对编程很新,我无法在任何地方找到它。基本上,我的一个变量的范围是0到200000,我试图使用pd.get_dummies为0和> 0值创建一个虚拟对象,但是我无法弄清楚如何,任何人都可以帮助我有这个吗?谢谢!
答案 0 :(得分:2)
考虑df
df = pd.DataFrame(dict(OneVar=[0, 1, 0, 3, 0, 5, 6, 0, 0, 9]))
在布尔系列
上使用pd.get_dummies
pd.get_dummies(df.OneVar.gt(0))
False True
0 1 0
1 0 1
2 1 0
3 0 1
4 1 0
5 0 1
6 0 1
7 1 0
8 1 0
9 0 1
使用重命名的列
pd.get_dummies(df.OneVar.gt(0)).rename(
columns=dict(enumerate(['IsZero', 'GtZero'])))
IsZero GtZero
0 1 0
1 0 1
2 1 0
3 0 1
4 1 0
5 0 1
6 0 1
7 1 0
8 1 0
9 0 1