我理解链式作业背后的想法,以及当我收到警告时
Pandas: SettingWithCopyWarning
让我知道我正在写一份副本,而不是原始数据框。
但我似乎无法成功实现.loc或.ix()或.iloc(),以便我实际上写入原始数据框。
如果'size'列不为null,我想将值设置为null。我试过了:
import numpy as np
df.loc[df['size'].notnull()].value=np.nan
我也尝试过使用替换功能,但无济于事(要替换的值都为零,因此.replace(0,np.nan)的实现也可以工作)。
答案 0 :(得分:2)
以下答案适用于原始问题(在OP编辑之前)。有问题的代码行是:
df.loc[df['size'].notnull() & df['value'] == 0].value = np.nan
我建议尝试这个(在[]中移动值):
df.loc[df['size'].notnull() & df['value'] == 0, 'value'] = np.nan
编辑:
这假设列名是' value'并且您没有尝试设置values属性(如上面的注释中所述,您不能这样做)
所以,这适用于以下数据框,例如:
d = {'size' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd']),
'value' : pd.Series([1., 2., 0.], index=['a', 'b', 'd'])}
df = pd.DataFrame(d)