使用python中其他变量的特定平均值和中值来估算缺失值

时间:2019-09-20 11:32:04

标签: python data-science

从“经验”列中有很多缺失值的数据集中,我被要求用数据集中另一个工作的经验平均值和另一个经验的中位数来估算它们。有人可以帮忙吗?谢谢

尝试获取数据科学家的经验平均值

#Creating a dataFrame
Data_science = df[["Metier", "Experience"]].copy()
Data_science

Data_science.isnull().sum()
output : Metier        19
Experience    94
dtype: int64

moyenne_dataS = Data_science['Experience'].mean()
moyenne_dataS

输出:--------------------------------------------- ------------------------------

  

TypeError跟踪(最近的呼叫   最后)   ----> 1 moyenne_dataS = Data_science [str(int ['Experience'])]。mean()         2 moyenne_dataS

     

TypeError:“类型”对象不可下标

遇到错误并且不知道要获取数据科学家经验的具体平均值和数据工程师的中位数

1 个答案:

答案 0 :(得分:0)

您可以在计算均值和中位数之前尝试过滤空值,例如:

int(enck[x])