我从python和数据科学开始,我有一个超过5000行的.csv文件。 我想用数据科学家的平均值和数据工程师的中位数替换“体验NaN”值。如何将其分组并使用fillna。
每次我尝试将fillna与mean()结合使用时,都会出现此错误:
TypeError:只能将str(而不是“ int”)连接到str NaN
答案 0 :(得分:4)
假设此表已在名为df
的变量中装入了Pandas。
还要假设当您说mean
和median
时是指Experience
列。
df.loc[
(df["Metier"] == "Data scientist") & (df["Experience"].isnull()), "Experience"
] = df["Experience"].mean()
df.loc[
(df["Metier"] == "Data engineer") & (df["Experience"].isnull()), "Experience"
] = df["Experience"].median()