在Pandas中分配列时处理SettingWithCopyWarning

时间:2017-02-24 12:44:10

标签: python pandas

我有一个DataFrame,我想用包含上一行数据的列进行扩展。

此脚本完成工作:

#!/usr/bin/env python3

import numpy as np
import pandas as pd

n = 2

df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [0,1,1,0,0]}, columns=['A', 'B'])

df2 = df[df['B'] == 0]
print(df2)

for i in range(1, n+1):
    df2['A_%d' % i] = df2['A'].shift(i)

print(df2)

输出:

   A  B
0  1  0
3  4  0
4  5  0

   A  B  A_1  A_2
0  1  0  NaN  NaN
3  4  0  1.0  NaN
4  5  0  4.0  1.0

这正是我想要的。 DataFrame现在有两个额外的列A_1A_2,其中包含列A 1 2 的值之前的行。

但是,我也收到了警告:

./my_script.py:14: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  df2['A_%d' % i] = df2['A'].shift(i)

问题肯定来自我创建df2之前的过滤。如果我直接使用df,则不会出现问题。 在我的应用程序中,我需要单独处理原始DataFrame的多个部分,因此过滤并且绝对是必需的。所有不同的部分(如此处的df2)稍后会连接起来。

我在How to deal with SettingWithCopyWarning in Pandas?Pandas SettingWithCopyWarning中发现了类似的问题,但那里的解决方案无法解决问题。

写作例如

df2[:, 'A_%d' % i] = df2['A'].shift(i)

同样的警告仍然存在。

我正在使用Python 3.5.2和Pandas 0.19.2

1 个答案:

答案 0 :(得分:3)

我认为你需要copy

df2 = df[df['B'] == 0].copy()

如果稍后修改df2中的值,您会发现修改不会传播回原始数据(df),并且Pandas会发出警告。