我有一个噪音很大的数据集,例如
import numpy as np
import matplotlib.pyplot as plt
N = 1000
x = np.linspace(0,10,N)
y = x + 20 * np.random.rand(N)
我想对给定binsize
(或binnumber
)的数据进行装箱。这样,我基本上只是一个Δx
。合并的数据应使用高斯函数加权,您可以将其视为在y轴上扩展的高斯函数,根据期望值µ
的距离对数据加权。另外,我希望数据能给我1σ-error
。
我对numpy.digitize
和scipy.stats.binned_statistic
有所了解,但是我无法应用这两者中的任何一个来获得所需的装箱。也许后者应该是这种情况下最容易使用的,因为它提供了参数statistic=<function>
,但我愿意提出建议。