df.loc导致SettingWithCopyWarning警告消息

时间:2017-01-26 09:13:40

标签: python pandas chained-assignment

我的代码的以下行会引发警告:

import pandas as pd

s = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
s.loc[-1] = [5,np.nan,np.nan,6]
grouped = s.groupby(['A'])
for key_m, group_m in grouped:
    group_m.loc[-1] = [10,np.nan,np.nan,10]

C:\Anaconda3\lib\site-packages\ipykernel\__main__.py:10: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

根据documentation这是推荐的做法,所以发生了什么?

感谢您的帮助。

1 个答案:

答案 0 :(得分:8)

文档有点令人困惑。

您的dataframe是另一个dataframe的副本。您可以通过运行bool(df.is_copy)来验证这一点。您正在收到警告,因为您正在尝试分配此副本。

警告/文档告诉您应该如何构建df。现在它不是你应该如何分配给它的。

df = some_other_df[cols]

df复制some_other_df。警告建议这样做

df = some_other_df.loc[:, [cols]]

现在已经完成,如果您选择忽略此警告,则可以

df = df.copy()

df.is_copy = None