在R中映射Zip Code与County shapefile

时间:2015-10-16 17:37:40

标签: r leaflet tiger-lines

我正在尝试为各种地理区域(即县/邮政编码)映射多边形。根据我在this blog找到的内容,我可以轻松地为各县实现这一目标。

library(rgdal)
library(rgeos)
library(leaflet)

url<-"http://www2.census.gov/geo/tiger/TIGER2010DP1/County_2010Census_DP1.zip"
downloaddir<-getwd()
destname<-"tiger_county.zip"
download.file(url, destname)
unzip(destname, exdir=downloaddir, junkpaths=TRUE)

filename<-list.files(downloaddir, pattern=".shp", full.names=FALSE)
filename<-gsub(".shp", "", filename)

# ----- Read in shapefile (NAD83 coordinate system)
# ----- this is a fairly big shapefile and takes 1 minute to read
dat<-readOGR(downloaddir, "County_2010Census_DP1") 

# ----- Create a subset of New York counties
subdat<-dat[substring(dat$GEOID10, 1, 2) == "36",]

# ----- Transform to EPSG 4326 - WGS84 (required)
subdat<-spTransform(subdat, CRS("+init=epsg:4326"))

# ----- save the data slot
subdat_data<-subdat@data[,c("GEOID10", "ALAND10")]

# ----- simplification yields a SpatialPolygons class
subdat<-gSimplify(subdat,tol=0.01, topologyPreserve=TRUE)

# ----- to write to geojson we need a SpatialPolygonsDataFrame
subdat<-SpatialPolygonsDataFrame(subdat, data=subdat_data)

leaflet() %>%
  addTiles() %>%
  addPolygons(data=subdat)

enter image description here

但如果我使用不同的邮政编码文件运行完全相同的代码

url <- "http://www2.census.gov/geo/tiger/GENZ2014/shp/cb_2014_us_zcta510_500k.zip"

我得到了一个完全不同的国家而不是纽约。

enter image description here

不确定某人是否更熟悉这些数据集和这些函数来解释为什么会出现这种差异?

1 个答案:

答案 0 :(得分:6)

鉴于@hrbrmstr注意到返回的邮政编码实际上是阿拉巴马州的邮政编码,这使我第二次猜测我之前对GEOID10变量结构的假设。我发现this link表示使用zcta文件,GEOID10变量实际上只是邮政编码,因此无法过滤与县文件相同的内容。

我想出了另一种使用zip_codes包中的noncensus数据集进行过滤的方法。然后我替换了行

subdat<-dat[substring(dat$GEOID10, 1, 2) == "36",]

代表

# get zip codes for New York
ny_zips <- zip_codes[zip_codes$state=="NY",]
subdat<-dat[dat$GEOID10 %in% ny_zips$zip,]

enter image description here