当我在numpy中运行/滚动意味着权重时,例如做这样的事情:
data = np.random.random(100) # Example data...
weights = np.array([1, 2, 1])
data_m = np.convolve(data, weights/float(np.sum(weights)), "same")
然后将data_m [0]和data_m [-1]替换为例如nans,取决于应用程序。
使用xarray可以完成同样的事情。我做的(在这种情况下)是
xr.DataArray(data).rolling(dim_0=3, center=True).mean(dim="dim_0")
但这对应于权重
weights = np.array([1, 1, 1])
在numpy例子中。使用xarray时如何应用其他权重?
答案 0 :(得分:4)
加权滚动均值尚未在xarray中实现。
以下几乎完全相同,但它会很慢。 我认为使用np.convolve是目前最好的选择。
def weighted_sum(x, axis):
weight = [1, 2, 1]
if x.shape[axis] == 3:
return np.sum(x * weight, axis=axis)
else:
return np.nan
da.rolling(dim_0=3, center=True).reduce(weighted_sum)
目前,我们正在努力支持更灵活(和更快)的滚动操作。见https://github.com/pydata/xarray/pull/1837
编辑:
使用xarray = 0.10.2,加权滚动平均值可以如下计算,
weight = xr.DataArray([0.25, 0.5, 0.25], dims=['window'])
da.rolling(dim_0=3, center=True).construct('window').dot(weight)
其中construct
方法构造滚动对象的视图,其中窗口维度(在上例中名为window
)被附加到最后一个位置。
带有权重数组的内积给出了沿窗口维度的加权和。
答案 1 :(得分:4)
如果你想要一个类似Gaussian
的过滤器,另一个黑客就是递归地应用滚动平均值。
boxcar滤波器的无限递归(即,我们的滚动均值)变为高斯滤波器。 有关详细信息,请参阅B-spline in wikipedia。
示例:
x = xr.DataArray([0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0], dims=['x'])
# With window=2
tmp = x
plt.plot(tmp, '-ok', label='original')
for i in range(3):
tmp = tmp.rolling(x=2, min_periods=1).mean()
plt.plot(tmp, '-o', label='{}-times'.format(i+1))
plt.legend()
# with window=3, center=True
tmp = x
plt.plot(tmp, '--ok', label='original')
for i in range(3):
tmp = tmp.rolling(x=3, center=True, min_periods=1).mean()
plt.plot(tmp, '-o', label='{}-times'.format(i+1))
plt.legend()
注意:如果要集中结果,请使用奇数窗口大小。
答案 2 :(得分:0)
这是[1,2,1]权重特有的,它需要两个步骤,所以它不是最好的解决方案,但它很快:
dim_name = "dim_0"
da_mean = da.rolling(**{dim_name: 3, "center": True}).mean(dim=dim_name)
da_mean = (3 * da_mean + da) / 4. # Expand it, and add the middle value.