用R计算欧几里得距离

时间:2020-10-17 10:32:49

标签: r dataframe datatables euclidean-distance

我有数据,其中行是点,列是坐标x,y,z。

enter image description here

我想计算成对点之间的欧几里得距离,例如3-4、11-12、18-19等...例如,我不需要3到11、12、18之间的距离 问题是我必须分析具有​​1000行或更多行的1074个表,因此我正在寻找一种自动执行此方法的方法,也许是考虑到我想计算奇数与偶数之间的距离这一事实。我不太在乎输出格式,但是请考虑一下,在我只需要选择<3.2的距离之后,这样数据帧格式就可以了。

谢谢! :*

2 个答案:

答案 0 :(得分:2)

这样的事情如何?

首先,我将制作一些假数据

set.seed(4304)
df <- data.frame(
  x = runif(1000, -1, 1), 
  y = runif(1000, -1, 1), 
  z = runif(1000, -1,1)
)

使值序列从1到数据集的行数增加2s。

s <- seq(1, nrow(df), by=2)

使用sapply()来确定每对点之间的距离。

out <- sapply(s, function(i){
  sqrt(sum((df[i,] - df[(i+1), ])^2))
})

将距离整理到一个数据框中

res <- data.frame(
  pair = paste(rownames(df)[s], rownames(df)[(s+1)], sep="-"), 
  dist=out)
head(res)
#     pair     dist
# 1   1-2 1.379992
# 2   3-4 1.303511
# 3   5-6 1.242302
# 4   7-8 1.257228
# 5  9-10 1.107484
# 6 11-12 1.392247

答案 1 :(得分:0)

这是可以应用于保存数据的数据框或矩阵的功能。

DistEucl <- function(X){
  i <- cumsum(seq_len(nrow(X)) %% 2 == 1)
  sapply(split(X, i), function(Y){
    sqrt(sum((Y[1, ] - Y[2, ])^2))
  })
}

DistEucl(df1)
#       1        2        3        4 
#1.229293 1.234273 1.245567 1.195319 

使用DaveArmstrong's answer中的数据,结果相同,除了上面函数的返回值中的names属性。

out2 <- DistEucl(df)
all.equal(out, out2)
#[1] "names for current but not for target"

identical(out, unname(out2))
#[1] TRUE

问题中的数据

x <- c(13.457, 13.723, 15.319, 15.713, 18.446, 19.488, 19.762, 19.743)
y <- c(28.513, 29.656, 28.510, 27.342, 28.827, 28.24, 29.841, 30.942)
z <- c(40.513, 40.147, 43.281, 43.218, 43.095, 43.443, 40.094, 40.559)

df1 <- data.frame(x, y, z)