分析空间连接(指向网格)的数据并在R中生成新数据集

时间:2014-09-23 18:21:00

标签: r spatial r-grid

我有一个数据集,其中包含经度/纬度点和每组坐标的结果值。我想创建一个空间网格,然后获取同一网格中坐标的结果平均值,并生成一个新的数据框,为每个坐标分配一个网格编号并具有平均结果。例如,从此代码开始:

require(sp)
require(raster)

frame <- data.frame(x = c(7.5, 8.2, 8.3), y = c(1,4,4.5), z = c(10,15,30))

coordinates(frame) <- c("x", "y")
proj4string(frame) <- CRS("+proj=longlat")

grid <- GridTopology(cellcentre.offset= c(0,0), cellsize = c(2,2), cells.dim = c(5,5))
sg <- SpatialGrid(grid)
poly <- as.SpatialPolygons.GridTopology(grid)
proj4string(poly) <-  CRS("+proj=longlat")

plot(poly)
text(coordinates(poly), labels = row.names(poly), col = "gray", cex. =.6)
points(frame$x, frame$y, col = "blue", cex = .8)

然后我想平均网格单元格中的结果(z)并生成一个看起来像这样的数据框(例如观察):

    x   y  z grid grid_mean
1 7.5 1.0 10   g20      10
2 8.2 4.0 15   g15     22.5
3 8.3 4.5 30   g15     22.5

感谢您的帮助。

1 个答案:

答案 0 :(得分:2)

您可以使用包over(...)中的sp功能。根据我的意见,你根本不需要包raster

require(sp)

frame  <- data.frame(x = c(7.5, 8.2, 8.3), y = c(1,4,4.5), z = c(10,15,30))
points <- SpatialPoints(frame)
proj4string(points) <-  CRS("+proj=longlat")

grid  <- GridTopology(cellcentre.offset= c(0,0), cellsize = c(2,2), cells.dim = c(5,5))
sg    <- SpatialGrid(grid)
poly  <- as.SpatialPolygons.GridTopology(grid)
proj4string(poly) <-  CRS("+proj=longlat")

# identify grids...
result <- data.frame(frame,grid=over(points,poly))
# calculate means...
result <- merge(result,aggregate(z~grid,result,mean),by="grid")
# rename and reorder columns to make it look like your result
colnames(result) <- c("grid","x","y","z","grid_mean")
result <- result[,c(2,3,4,1,5)]
result
#     x   y  z grid grid_mean
# 1 8.2 4.0 15   15      22.5
# 2 8.3 4.5 30   15      22.5
# 3 7.5 1.0 10   25      10.0

over(x,y,...)函数将两个Spatial*对象作为叠加层进行比较,并将带有索引的向量返回到y中每个几何体的x。在这种情况下,x是SpatialPoints对象,y是SpatialPolygons对象。因此over(...)标识与y中每个点相关联的x中的多边形ID(网格单元格)。其余的只是计算平均值,将平均值与原始数据框合并,并重命名和重新排序列,以便结果看起来像你的结果。

我稍微调整了你的代码,因为它没有意义:你创建一个带有z值的数据框,然后将它转换为一个SpatialPoints对象,它丢弃了z值......