计算矩阵中每个元素的最近邻居的标准偏差的有效方法

时间:2017-06-21 06:22:46

标签: r performance matrix standard-deviation

我想计算矩阵中每个元素的最近邻居(3 * 3移动窗口)的标准偏差。我在R中编写了一些代码来实现它:

library(FNN)    
df <- matrix(1:10000, nrow = 100, ncol = 100, byrow = TRUE)

df_ <- reshape2::melt(df)
df_index <- df_[, c(1,2)]

df_query <- df_index
neighbor_index <- knnx.index(df_index, df_query, k = 9, algorithm = 'kd_tree')

neighbor_coor<- apply(neighbor_index, 1, function(x) df_query[x, ])

neighbor_sd <- lapply(neighbor_coor, function(x) sd(df[x[, 1], x[, 2]]))

sd <- do.call(rbind, neighbor_sd)

但速度太慢了。你能给我一些建议来加快速度吗?还有其他方法可以实现吗?

1 个答案:

答案 0 :(得分:1)

正如@romanlustrik在他的评论中提出的,我们可以使用raster::focal()来解决这个问题。

library(raster)

df <- matrix(1:10000, nrow = 100, ncol = 100, byrow = TRUE)
dfR <- raster(df)

dfSD <- as.matrix(focal(dfR, w = matrix(1,3,3), fun = sd))

其中,w是表示最近邻居的矩阵,它们的权重在fun内(在这种情况下,3x3是单元本身,它是8个邻居)。因此,任何邻域模式都是可以想象的,只要它可以用矩阵表示即可。

matrix(1,3,3)
#      [,1] [,2] [,3]
# [1,]    1    1    1
# [2,]    1    1    1
# [3,]    1    1    1

仅有4个邻居(不包括对角线和单元本身)的示例:

matrix(c(0,1,0,1,0,1,0,1,0), 3, 3)
#      [,1] [,2] [,3]
# [1,]    0    1    0
# [2,]    1    0    1
# [3,]    0    1    0