数据预处理非常不寻常的数据

时间:2017-03-06 20:30:57

标签: machine-learning data-processing

我有一个包含大约100k数据的数据集,并且我有一个人员薪水的列。我只有8k细胞,工资超过100k细胞。正如您所看到的,薪水栏的大多数单元格都是空的。现在在8k小区中,我有500个单元,工资正好99k,6个单元,工资4万,7个单元,工资34k。 8k细胞的其余细胞的工资从27k逐渐下降。因此,该列的总数据集如下所示

500 cells => 99k 
6 cells => 40
7 cells => 34k 
7487 cells => gradual decrease of salary from 27k to 10k
92k cells => no data

现在,我该如何处理这些数据?

0 个答案:

没有答案