在Pandas中用.loc覆盖Nan值

时间:2017-02-24 22:13:19

标签: python pandas nan loc

我尝试使用以下代码行解决所需的任务:

df['Age'][np.isnan(df["Age"])] = rand1

enter image description here

但这会引发一场" SettingWithCopyWarning"我认为使用.loc功能在数据框中定位Nan值(Column' Age')可能是更好的方法。

我已经看了documentation,但仍然不知道如何解决这个问题。无法在.loc处找到任何解决方案。

我很感激任何提示和建议。

1 个答案:

答案 0 :(得分:3)

您需要fillna才能将NaN替换为某个值:

df.Age = df.Age.fillna(rand1)

您的解决方案loc

df.loc[np.isnan(df["Age"]), 'Age'] = rand1
#same as
#df.loc[df["Age"].isnull(), 'Age'] = rand1

您还可以查看indexing view versus copy

样品:

df = pd.DataFrame({'Age':[20,23,np.nan]})
print (df)
    Age
0  20.0
1  23.0
2   NaN

rand1 = 30
df.Age = df.Age.fillna(rand1)
print (df)
    Age
0  20.0
1  23.0
2  30.0
#if need cast to int
df.Age = df.Age.fillna(rand1).astype(int)
print (df)
   Age
0   20
1   23
2   30