我想计算矩阵中每个元素的最近邻居(3 * 3移动窗口)的标准偏差。我在R中编写了一些代码来实现它:
library(FNN)
df <- matrix(1:10000, nrow = 100, ncol = 100, byrow = TRUE)
df_ <- reshape2::melt(df)
df_index <- df_[, c(1,2)]
df_query <- df_index
neighbor_index <- knnx.index(df_index, df_query, k = 9, algorithm = 'kd_tree')
neighbor_coor<- apply(neighbor_index, 1, function(x) df_query[x, ])
neighbor_sd <- lapply(neighbor_coor, function(x) sd(df[x[, 1], x[, 2]]))
sd <- do.call(rbind, neighbor_sd)
但速度太慢了。你能给我一些建议来加快速度吗?还有其他方法可以实现吗?
答案 0 :(得分:1)
正如@romanlustrik在他的评论中提出的,我们可以使用raster::focal()
来解决这个问题。
library(raster)
df <- matrix(1:10000, nrow = 100, ncol = 100, byrow = TRUE)
dfR <- raster(df)
dfSD <- as.matrix(focal(dfR, w = matrix(1,3,3), fun = sd))
其中,w
是表示最近邻居的矩阵,它们的权重在fun
内(在这种情况下,3x3是单元本身,它是8个邻居)。因此,任何邻域模式都是可以想象的,只要它可以用矩阵表示即可。
matrix(1,3,3)
# [,1] [,2] [,3]
# [1,] 1 1 1
# [2,] 1 1 1
# [3,] 1 1 1
仅有4个邻居(不包括对角线和单元本身)的示例:
matrix(c(0,1,0,1,0,1,0,1,0), 3, 3)
# [,1] [,2] [,3]
# [1,] 0 1 0
# [2,] 1 0 1
# [3,] 0 1 0