使用行方式数据的spplot()点阵图表

时间:2013-03-07 13:17:45

标签: r graphics rgdal

当数据按行排列时,如何使用spplot()创建晶格图,例如每个地区都有更多的价值(我对地区unemp多年(year)的失业率CSO_NAME)

这是我加载地图和合并数据的代码:

library(rgdal)
library(sqldf)

# Import map and assign data.shape@data to spdata
data.shape<-readOGR(dsn="folder",layer="mylayer")    
spdata <- data.shape@data

# Load statistics data
unemp <- read.csv("cso_unemployment_rwise.csv")

# Merge data with spdata
spdata <- sqldf("select sp.*, cu.year, cu.unemp from spdata sp join unemp cu on (sp.nazok_a = cu.CSO_NAME) ")

# Build new spdata
spdata_merged <- SpatialPolygonsDataFrame(data.shape, spdata) 
# This fails: length(Sr@polygons) == nrow(data) is not TRUE

我认为我可以使用与formula类似的内容,例如像barchart这样的例子:

barchart(spdata$year~spdata$unemp|spdata$CSO_NAME)

但是因为我无法将数据与多边形合并,所以我不知道下一步应该是什么。在这种情况下,我可以轻松地转置数据,然后使用类似的东西:

spplot(spdata,c("y2009","y2010","y2011","y2012",...))

可重复的示例

以下是示例数据,stats_data只有一个分组变量yearstats_data2,其中包含两个分组变量yearsex

# Get map
con <- url("http://gadm.org/data/rda/CZE_adm2.RData")
print(load(con))
close(con)
gadm_data <- gadm@data

# Create sample Data
stats_data <-
  data.frame(

      as.character(rep(gadm_data$NAME_2,3)),
      as.numeric(round(runif(3*length(gadm_data$NAME_2), 0, 1),digits=3)*100),
      as.factor(rep(c(2010,2011,2012),length(gadm_data$NAME_2)))
  )
names(stats_data) <- c("NAME_2","UNEMPR","YEAR") # str(stats_data)

# Add each year to map data
library("sqldf")
gadm_data <- sqldf("select gd.*, sd.UNEMPR as u2010 from gadm_data gd join stats_data sd using (NAME_2) where year = 2010")
gadm_data <- sqldf("select gd.*, sd.UNEMPR as u2011 from gadm_data gd join stats_data sd using (NAME_2) where year = 2011")
gadm_data <- sqldf("select gd.*, sd.UNEMPR as u2012 from gadm_data gd join stats_data sd using (NAME_2) where year = 2012")
gadm@data <- gadm_data

# Plot     
spplot(gadm,c("u2010","u2011","u2012"),at=c(0,10,20,30,40,50,70,100))

# Create sample Data, two factor variables
stats_data2 <-
  data.frame(

    as.character(rep(gadm_data$NAME_2,6)),
    as.numeric(round(runif(6*length(gadm_data$NAME_2), 0, 1),digits=3)*100),
    as.factor(rep(c(2010,2011,2012),2*length(gadm_data$NAME_2))),
    as.factor(c("f","m"))
  )
names(stats_data2) <- c("NAME_2","UNEMPR","YEAR","SEX") # str(stats_data2)

我可以使用sqldf进行丑陋的数据操作,但是随着更多因素的添加,这会变得越来越复杂。假设我有2个因子,2个和10个值,那么我必须添加20个列。

R版本2.15.1,Windows XP,SP3

0 个答案:

没有答案