我有一个空间点数据框和一个空间多边形数据框。例如,我的多边形将是曼哈顿中每个块的多边形。分数是人,分散在各处,有时落在街道中间,不是多边形的一部分。
我知道如何检查多边形中是否包含一个点,但是如何将点分配给它们最接近的多边形呢?
## Make some example data
set.seed(1)
library(raster)
library(rgdal)
library(rgeos)
p <- shapefile(system.file("external/lux.shp", package="raster"))
p2 <- as(1.5*extent(p), "SpatialPolygons")
proj4string(p2) <- proj4string(p)
pts <- spsample(p2-p, n=10, type="random")
## Plot to visualize
plot(pts, pch=16, cex=.5,col="red")
plot(p, col=colorRampPalette(blues9)(12), add=TRUE)
答案 0 :(得分:16)
这是一个答案,使用的方法基于几年前this excellent answer中mdsumner所描述的方法。
一个重要的注释(在2015年2月8日编辑添加): rgeos ,这里用于计算距离,期望它的几何形状操作将以平面坐标投影。对于这些示例数据,这意味着它们应首先转换为UTM坐标(或一些其他平面投影)。如果您错误地将数据保留在原始的lat-long坐标中,则计算出的距离将是不正确的,因为它们将经度和经度视为具有相等的长度。
library(rgeos)
## First project data into a planar coordinate system (here UTM zone 32)
utmStr <- "+proj=utm +zone=%d +datum=NAD83 +units=m +no_defs +ellps=GRS80 +towgs84=0,0,0"
crs <- CRS(sprintf(utmStr, 32))
pUTM <- spTransform(p, crs)
ptsUTM <- spTransform(pts, crs)
## Set up container for results
n <- length(ptsUTM)
nearestCantons <- character(n)
## For each point, find name of nearest polygon (in this case, Belgian cantons)
for (i in seq_along(nearestCantons)) {
nearestCantons[i] <- pUTM$NAME_2[which.min(gDistance(ptsUTM[i,], pUTM, byid=TRUE))]
}
## Check that it worked
nearestCantons
# [1] "Wiltz" "Echternach" "Remich" "Clervaux"
# [5] "Echternach" "Clervaux" "Redange" "Remich"
# [9] "Esch-sur-Alzette" "Remich"
plot(pts, pch=16, col="red")
text(pts, 1:10, pos=3)
plot(p, add=TRUE)
text(p, p$NAME_2, cex=0.7)
答案 1 :(得分:1)
我在这里参加聚会已经很晚了,但是我才发现这个话题,并为此提供了建议。 RANN软件包中的nn2函数允许您仅在某些有限的半径内搜索(寻找最接近的点),这可以节省大量时间。我的建议是在多边形上添加点,将这些点与多边形关联,然后搜索最接近的点。 似乎在没有很多点的情况下gDistance方法会更快,但是nn2方法可以更好地扩展到较大的问题,因为它会搜索有限的半径(当然,如果在该半径内没有点,它将无法找到匹配项,因此必须正确选择半径)。 我是新手,所以这可能不是最佳选择。如果gDistance允许受限搜索,那就太好了。
confirmDialog = $("#confirmDialog").dialog({
dialogClass: "no-close",
autoOpen: false,
height: 'auto',
width: 350,
modal: true,
resizable: false
});