初始数据框:
df =
Index Nature Interval
0 0 1 0.000000
1 1 1 0.999627
2 2 1 1.000607
3 3 1 1.000612
参赛作品总数约为700,000。
有没有办法找到“Interval”列中的一个元素与同一列中所有剩余元素之间的差异,并且必须对剩余的数据帧执行相同的操作。
我找到了解决此问题的方法。该片段是
df["Potential"] = df["Interval"].apply(lambda x:print(np.sum([math.exp(-4 * abs(x - val)) for val in df['Interval']])))
然而,由于使用了for循环,它需要花费太多时间。
有没有办法优化解决方案。
答案 0 :(得分:5)
您可以使用 .header-logo img {
max-width: 100%;
max-height: auto;
}
:
apply
Numpy解决方案将b = df["Interval"].apply(lambda x: np.sum(np.exp(-4 * (x - df.Interval).abs())))
print (b)
0 1.054885
1 3.010498
2 3.014339
3 3.014319
Name: Interval, dtype: float64
列的值重新整形为' row'然后应用Intrval
,abs
和np.exp
:
np.sum
另一个笨拙的解决方案,谢谢val = df.Interval.values
arr = np.sum(np.exp(-4*abs(val-val.reshape(len(df.index),-1))), axis=0)
print (arr)
[ 1.05488507 3.01049841 3.0143389 3.01431861]
df["Potential"] = arr
print (df)
Index Nature Interval Potential
0 0 1 0.000000 1.054885
1 1 1 0.999627 3.010498
2 2 1 1.000607 3.014339
3 3 1 1.000612 3.014319
:
piRSquared