将spanish shapefile与数据框

时间:2016-06-27 08:48:40

标签: r merge gis spatial shapefile

我在将西班牙省份的shapefile与特定数据帧合并时遇到问题。在合并它们之后,不知何故形状与假省相关联(例如巴塞罗那返回特鲁埃尔的形状)。我搜索了一些例子,但我无法理解我做错了什么。

所有必需的文件都存储在此文件夹中: Dropbox folder

library(maptools)
library(dplyr)
library(data.table)
library(reshape2)

我将所有必要的文件输入R:

gor=readShapeSpatial('prov_map.shp')
prov=read.csv("prov.csv",sep = ';')
prov=subset(prov,select=-X)

我更正了数据文件中的省名,因此它们在实际名称之前没有数字,然后我将结果变量转换为一个因子:

provcorr=colsplit(prov$Province," ",c("Prov_num","Province"))
prov$prov_num=provcorr$Prov_num
prov$province_nonum=provcorr$Province 
prov$provfact=as.factor(prov$province_nonum)   

由于西班牙语的重音,shapefile中的省名有点奇怪,所以我更正它们以便它们匹配数据帧中的那些:

prov_nom=c("Melilla","Ceuta", "Zaragoza","Zamora", "Bizkaia",
       "Valladolid","Valencia/València","Toledo","Teruel",
       "Tarragona","Soria","Sevilla","Segovia","Cantabria",
       "Salamanca","Pontevedra","Palencia","Asturias","Ourense",
       "Navarra","Murcia","Málaga","Madrid","Lugo","Rioja, La",
       "Lleida", "León", "Jaén", "Huesca", "Huelva", "Gipuzkoa",
       "Guadalajara","Granada","Girona","Cuenca","Coruña, A",
       "Córdoba", "Ciudad Real", "Castellón/Castelló","Cádiz",
       "Cáceres", "Burgos","Barcelona", "Balears, Illes", "Badajoz",
       "Ávila", "Almería", "Alicante/Alcant","Albacete","Araba/Álava") 
gor@data$NAMEBIEN=as.factor(prov_nom)

到目前为止,形状与省名完全一致。例如,如果我输入:

plot(subset(gor,gor@data$NAMEBIEN=='Barcelona'))

巴塞罗那的形状出现了。但在我尝试将它们合并到:

之后
gor@data=merge(gor@data,prov,by.x='NAMEBIEN',by.y='provfact',all.x=T)

现在已经不是这样了。当我输入与之前相同的代码时,如下所示:

plot(subset(gor,gor@data$NAMEBIEN=='Barcelona'))
特鲁埃尔的形状出现了。

这个问题让我发疯。有什么建议?

1 个答案:

答案 0 :(得分:2)

问题是合并会改变数据框的顺序。在原始数据帧中,Teruel与第9个多边形相关联。但是在合并data.frame中的第9个条目之后是巴塞罗那,因此与特鲁埃尔的多边形相关联。添加参数sort = FALSE,它应该可以工作。

gor@data=merge(gor@data,prov,by.x='NAMEBIEN',by.y='provfact',all.x=T, sort = FALSE)
plot(subset(gor,gor@data$NAMEBIEN=='Barcelona'))

enter image description here