我正在尝试清理数据集,基本上摆脱了所有具有一定数量空值的功能,包括pandas / python在内的100多个空值。我使用以下命令
train.isnull().sum()>=100
让我:
Id False
Feature 1 False
Feature 2 False
Feature 3 True
Feature 4 False
Feature 5 True
我想返回一个没有3和4特征的新数据帧。
谢谢。
答案 0 :(得分:1)
在你的情况下,只需运行:
train[train.columns[train.isnull().sum()<100]]
完整示例:
import pandas as pd
df = pd.DataFrame([[1,None,2],[3,4,None],[7,8,9]], columns = ['A','B','C'])
你会得到:
A B C 0 1 NaN 2.0 1 3 4.0 NaN 2 7 8.0 9.0
然后运行:
df.isnull().sum()
将导致空计数:
A 0 B 1 C 1
然后只需选择想要的列:
df.columns[df.isnull().sum()<100]
并过滤您的数据框:
df[ df.columns[df.isnull().sum()<100]]