我有两个表,X和Y,(X是大的,Y有9行,当然是相同的列),我需要找到每行X与每行Y之间的最小欧氏距离。 我这样做并且有效:
x<-matrix(c(3,6,3,4,8),nrow=5,ncol=7,byrow = TRUE)
y<-matrix(c(1,4,4,1,9),nrow=5,ncol=7,byrow = TRUE)
unlist(lapply(seq_len(nrow(y)), function(i) min(sqrt(colSums((y[i, ] -t(x))^2))))
现在我需要导出哪一行Y(1到9)是每行的一行,并且有我的问题,因为我不知道如何面对这一点。关于如何写这个的任何线索? 我一直在考虑做类似的事情:
unlist(lapply(seq_len(nrow(y)), function(i) nrow(min(sqrt(colSums((y[i, ] - t(x))^2)))==T)))
但我不能让它发挥作用。
谢谢!
答案 0 :(得分:1)
您可以使用我的imputation包轻松完成此操作:
Sys.setenv("PKG_CXXFLAGS"="-std=c++0x") # needed for the lambda functions in Rcpp
# install/load package, create example data
devtools::install_github("alexwhitworth/imputation")
library(imputation)
set.seed(123)
a <- matrix(rnorm(10000), ncol= 10)
b <- matrix(rnorm(100), ncol=10)
# which row of a is closest to each row of b
apply(b, 1, function(i, a) {
which.min(imputation:::dist_q.matrix(rbind(i, a), ref= 1L, q=2))
}, a= a)
[1] 471 502 555 969 692 757 116 913 556 566
# which row of b is closest to each row of a
apply(a, 1, function(i, b) {
which.min(imputation:::dist_q.matrix(rbind(i, b), ref= 1L, q=2))
}, b= b)
### result not shown since it's large
从技术上讲,您不需要参数ref
和q
,因为1L
和2
是默认值。