Question

初始数据框：

df = 
             Index   Nature  Interval
0            0       1       0.000000
1            1       1       0.999627
2            2       1       1.000607
3            3       1       1.000612

参赛作品总数约为700,000。

有没有办法找到“Interval”列中的一个元素与同一列中所有剩余元素之间的差异，并且必须对剩余的数据帧执行相同的操作。

我找到了解决此问题的方法。该片段是

df["Potential"] = df["Interval"].apply(lambda x:print(np.sum([math.exp(-4 * abs(x - val)) for val in df['Interval']])))

然而，由于使用了for循环，它需要花费太多时间。

有没有办法优化解决方案。

Answer 1

您可以使用.header-logo img { max-width: 100%; max-height: auto; }：

apply

Numpy解决方案将b = df["Interval"].apply(lambda x: np.sum(np.exp(-4 * (x - df.Interval).abs()))) print (b) 0 1.054885 1 3.010498 2 3.014339 3 3.014319 Name: Interval, dtype: float64列的值重新整形为＆＃39; row＆＃39;然后应用Intrval，abs和np.exp：

np.sum

另一个笨拙的解决方案，谢谢val = df.Interval.values arr = np.sum(np.exp(-4*abs(val-val.reshape(len(df.index),-1))), axis=0) print (arr) [ 1.05488507 3.01049841 3.0143389 3.01431861] df["Potential"] = arr print (df) Index Nature Interval Potential 0 0 1 0.000000 1.054885 1 1 1 0.999627 3.010498 2 2 1 1.000607 3.014339 3 3 1 1.000612 3.014319：

piRSquared

在python pandas dataframe中找出一行值与剩余行值的差异

1 个答案: