Xarray滚动意味着重量

时间:2018-01-29 22:06:42

标签: python numpy python-xarray xarray

当我在numpy中运行/滚动意味着权重时,例如做这样的事情:

data = np.random.random(100)  # Example data...
weights = np.array([1, 2, 1])
data_m = np.convolve(data, weights/float(np.sum(weights)), "same")

然后将data_m [0]和data_m [-1]替换为例如nans,取决于应用程序。

使用xarray可以完成同样的事情。我做的(在这种情况下)是

xr.DataArray(data).rolling(dim_0=3, center=True).mean(dim="dim_0")

但这对应于权重

weights = np.array([1, 1, 1])

在numpy例子中。使用xarray时如何应用其他权重?

3 个答案:

答案 0 :(得分:4)

加权滚动均值尚未在xarray中实现。

以下几乎完全相同,但它会很慢。 我认为使用np.convolve是目前最好的选择。

def weighted_sum(x, axis):
    weight = [1, 2, 1]
    if x.shape[axis] == 3:
        return np.sum(x * weight, axis=axis)
    else:
        return np.nan

da.rolling(dim_0=3, center=True).reduce(weighted_sum)

目前,我们正在努力支持更灵活(和更快)的滚动操作。见https://github.com/pydata/xarray/pull/1837

编辑:

使用xarray = 0.10.2,加权滚动平均值可以如下计算,

weight = xr.DataArray([0.25, 0.5, 0.25], dims=['window'])
da.rolling(dim_0=3, center=True).construct('window').dot(weight)

其中construct方法构造滚动对象的视图,其中窗口维度(在上例中名为window)被附加到最后一个位置。 带有权重数组的内积给出了沿窗口维度的加权和。

答案 1 :(得分:4)

如果你想要一个类似Gaussian的过滤器,另一个黑客就是递归地应用滚动平均值。

boxcar滤波器的无限递归(即,我们的滚动均值)变为高斯滤波器。 有关详细信息,请参阅B-spline in wikipedia

示例:

x = xr.DataArray([0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0], dims=['x'])

# With window=2
tmp = x
plt.plot(tmp, '-ok', label='original')
for i in range(3):
    tmp = tmp.rolling(x=2, min_periods=1).mean()
    plt.plot(tmp, '-o', label='{}-times'.format(i+1))
plt.legend()

recursive rolling mean with window size 2

# with window=3, center=True
tmp = x
plt.plot(tmp, '--ok', label='original')
for i in range(3):
    tmp = tmp.rolling(x=3, center=True, min_periods=1).mean()
    plt.plot(tmp, '-o', label='{}-times'.format(i+1))
plt.legend()

recursive rolling mean with window size 3 with the centralization

注意:如果要集中结果,请使用奇数窗口大小。

答案 2 :(得分:0)

这是[1,2,1]权重特有的,它需要两个步骤,所以它不是最好的解决方案,但它很快:

dim_name = "dim_0"
da_mean = da.rolling(**{dim_name: 3, "center": True}).mean(dim=dim_name)
da_mean = (3 * da_mean + da) / 4.  # Expand it, and add the middle value.