Pandas脚本可自动删除Na值超过60%的列

时间:2019-08-20 05:01:03

标签: python-3.x pandas data-cleaning

丢弃NaN值超过60%的所有列,或制作一个脚本来删除/删除NaN值超过60%的所有列

我尝试将“ num”作为所有列索引(给定范围)的列索引号进行迭代,但是对于“ cols”,错误是越界的,尽管每个代码行都可以单独完美地工作


num=0;
for num in range(145):
    ttl = dataset.shape[0] #Total number of rows
    cols = dataset.iloc[:,num].isnull().sum()  #Total NaN of that column
    if(cols>0.6*ttl):
        dataset.drop(dataset.iloc[:, num:num+1], inplace = True, axis = 1)

IndexError:单个位置索引器超出范围 Error msg image 1 Error Msg image 2

0 个答案:

没有答案