我有一个数据框,我试图看看数据框的哪个部分拥有最完整的数据。
正如用户可以填写的三个潜在调查一样,我正在努力确定哪个行业拥有最高水平的用户,这些用户填写了所有三个调查。
因此,我不关心数字响应,而是关注数据是否存在,所以我试图将所有不是0的数据更改为1,这样我就可以按行业计算完整响应的总量。 / p>
如何为只有2列字符串数据(分类数据)的数据集执行此操作,其余为浮点数。
我尝试了.replace
,但它没有用。
brands = brands.replace([>0.001], 1)
我想从
更改数据a c 23.45 232.40 2123.000
b d 0 0 0
e g 2.21 0.61 0
到
a c 1 1 1
b d 0 0 0
e g 1 1 0
答案 0 :(得分:1)