如何使用cudf删除带有NA的列?

时间:2019-05-30 16:38:00

标签: python rapids cudf

熊猫:

data = data.dropna(axis = 'columns')

我正在尝试使用cudf数据框执行类似的操作,但是api不提供此功能。

我的解决方案是将其转换为pandas df,执行上述命令,然后重新转换为cudf。有更好的解决方案吗?

2 个答案:

答案 0 :(得分:2)

cuDF现在支持基于列的dropna,因此以下各项将起作用:

import cudf
​
df = cudf.DataFrame({'a':[0,1,None], 'b':[None,0,2], 'c':[1,2,3]})
print(df)
      a     b  c
0     0  null  1
1     1     0  2
2  null     2  3
df.dropna(axis='columns')
    c
0   1
1   2
2   3

答案 1 :(得分:1)

在实施sudo npm install -g mongoose 之前,您可以检查每一列的dropna并使用null_count删除它们。