根据坐标获取最近的点

时间:2014-07-11 09:39:51

标签: r coordinates distance euclidean-distance

我想根据他们在R的距离将单点捕捉到其他点。 详细地说,我有一堆由X和Y坐标对定义的点。 另外我有一个不同的点,我想要捕捉 最近的邻居(欧几里德距离)。

# target points
df <- data.frame(X=c(1,2,2,2,3,4),Y=c(1,2,2,3,3,4))

# points that need snapping
point1 <- data.frame(X=2.1, Y=2.3)
point2 <- data.frame(X=2.5, Y=2.5)


plot(df)
points(point1$X,point1$Y,pch=20,col="red")
points(point2$X,point2$Y,pch=20,col="blue")

但是如何继续抓点?  如何捕捉点并为单个点分配新的坐标对? R中是否有简单的功能?或者我需要申请 dist()函数获取距离矩阵并搜索 最近的距离?也许有一种更直接的方式。

这应该是什么样子:

1)捕捉到最近的(欧几里德距离)点(点1的清晰解)

point1$X_snap <- 2
point1$Y_snap <- 2

2)如果两个或两个以上的点比较接近 抓住更多东西&#34;东北&#34; a)首先捕捉到更北方(Y方向)的那个 b)如果在Y方向上有一个以上相似的距离,则不止一个 到更东方的那个

point2$X_snap <- 3
point2$Y_snap <- 3

有关结果应如何显示的图形说明

#plot snapped points:
points(point1$X_snap,point1$Y_snap,pch=8,col="red")
points(point2$X_snap,point2$Y_snap,pch=8,col="blue")

3 个答案:

答案 0 :(得分:2)

可以使用dist

 dist(rbind(point1,df))
          1         2         3         4         5
2 1.7029386                                        
3 0.3162278 1.4142136                              
4 0.3162278 1.4142136 0.0000000                    
5 0.7071068 2.2360680 1.0000000 1.0000000          
6 1.1401754 2.8284271 1.4142136 1.4142136 1.0000000
7 2.5495098 4.2426407 2.8284271 2.8284271 2.2360680
          6
2          
3          
4          
5          
6          
7 1.4142136

因此,第一列中具有最小值(距离)的行标识df中最接近point1的点。在您的示例中,您有一个重复的位置。对每个point_x重复一次。

答案 1 :(得分:2)

我找到了另一个使用matchpt()函数的解决方案 来自Biobase(Bioconductor):

# target points
df <- data.frame(X=c(1,2,2,2,3,4),Y=c(1,2,2,3,3,4))

# points that need snapping
point1 <- data.frame(X=2.1, Y=2.3)
point2 <- data.frame(X=2.5, Y=2.5)

snap <- function(df,point){
  require(Biobase)
  d <- matchpt(as.matrix(df),
               as.matrix(data.frame(X=point$X+0.0001,Y=point$Y+0.0001))) # to the "northwest" criteria correct

  min_row <- as.numeric(rownames(d[d$distance==min(d$distance),]))

  point$X_snap <- unique(df[min_row,"X"])
  point$Y_snap <- unique(df[min_row,"Y"])

  point
}

snap(df,point2)

答案 2 :(得分:0)

我会将标准(距离,#34;南方&#34;,&#34;西方&#34;)放在数据框中,然后按照这些标准对此数据框进行排序:

# input data
df <- data.frame(X=c(1,2,2,2,3,4),Y=c(1,2,2,3,3,4))
point1 <- data.frame(X=2.1, Y=2.3)
point2 <- data.frame(X=2.5, Y=2.5)
df.res[with(df.res, order(dst, dy, dx)), ]

# function that sorts all potential snapping points according to distance, "westness", "southness"
snap.xy <- function(point, other.points) {
  df.res <- data.frame(X = other.points$X,   # to later access the coordinates to snap to
                       Y = other.points$Y,   # dto
                       dx <- point$X - other.points$X, # "westness" (the higher, the more "west")
                       dy <- point$Y - other.points$Y, # "southness"
                       dst = sqrt(dx^2 + dy^2))        # distance
  # print(df.res[with(df.res, order(dst, dy, dx)), ])  # just for checking the results
  return(df.res[with(df.res, order(dst, dy, dx)), ][1,c("X", "Y")])  # return only the X/Y coordinates
}

# examples
snap.xy(point1, df)    # 2/2
snap.xy(point2, df)    # 3/3
snap.xy(point2, df)$X  # 3
snap.xy(point2, df)$Y  # 3