Question

我有一个小函数在pandas中的一列上执行一系列nan值。这个函数有点棘手，因为我想在从nan切换到非nan单元时重置值。

Ex：[1.，1.，nan，nan，2.，nan，nan，3。]给出[0.，0,1。，2.，0.，1.，2.，0 ]

无论如何，该功能正在运行，现在是：

def count_nan_reset(v):
vm = v.copy()
vm = v.as_matrix()
vm[~np.isnan(vm)] = 2 # arbitraire
vm[np.isnan(vm)] = 1
vm[vm==2] = np.nan
n = np.isnan(vm)
a = ~n
c = np.cumsum(a)
d = np.diff(np.concatenate(([0.], c[n])))
vm[n] = -d
fin = np.cumsum(vm)
return fin

我遇到的问题是，当我尝试将此函数作为输入应用于列时，它会更改列本身（就像inplace = True选项一样）!!

例如：

d = {'Values_for_trial' : pd.Series([1., 1., np.nan, np.nan, 2., np.nan, np.nan, 3.])}
df = pd.DataFrame(d)
df["results"] = count_nan_reset(df["Values_for_trial"])

它改变了df中的值[＆＃34; Values_for_trial＆＃34;]

我真的不知道为什么有人可以帮助你非常感谢!!

Answer 1

因为vm不是副本，

您需要更改

def count_nan_reset(v):
    vm = v.copy()
    vm = v.as_matrix()

要

def count_nan_reset(v):
    vm = v.copy().as_matrix()
    ...

熊猫：用作输入修改的整列

1 个答案: