我正在尝试删除一项功能,该功能如果为float且缺失值的数量大于特定数量。
我尝试过:
# Define threshold to 1/6
threshold = 0.1667
# Drop float > threshold
for f in data:
if data[f].dtype==float & data[f].isnull().sum() / data.shape[0] > threshold: del data[f]
..这会引发错误:
TypeError:&:'type'和不支持的操作数类型 'numpy.float64'
将不胜感激。
答案 0 :(得分:0)
仅将DataFrame.select_dtypes
用于浮点列,检查缺失值并获取mean
-sum/count
并按Series.reindex
添加另一个非浮点列,最后按{{1}进行过滤}由boolean indexing
到inverse
的条件>
:
<=