我已经在流动数据中学到了一些我学到的东西great circle mapping tutorial,并将它们与评论中链接的代码相结合,以防止在R描绘跨赤道大圆时发生奇怪的事情。这给了我这个:
airports <- read.csv("/home/geoff/Desktop/DissertationData/airports.csv", header=TRUE)
flights <- read.csv("/home/geoff/Desktop/DissertationData/ATL.csv", header=TRUE, as.is=TRUE)
library(maps)
library(geosphere)
checkDateLine <- function(l){
n<-0
k<-length(l)
k<-k-1
for (j in 1:k){
n[j] <- l[j+1] - l[j]
}
n <- abs(n)
m<-max(n, rm.na=TRUE)
ifelse(m > 30, TRUE, FALSE)
}
clean.Inter <- function(p1, p2, n, addStartEnd){
inter <- gcIntermediate(p1, p2, n=n, addStartEnd=addStartEnd)
if (checkDateLine(inter[,1])){
m1 <- midPoint(p1, p2)
m1[,1] <- (m1[,1]+180)%%360 - 180
a1 <- antipode(m1)
l1 <- gcIntermediate(p1, a1, n=n, addStartEnd=addStartEnd)
l2 <- gcIntermediate(a1, p2, n=n, addStartEnd=addStartEnd)
l3 <- rbind(l1, l2)
l3
}
else{
inter
}
}
# Unique months
monthyear <- unique(flights$month)
# Color
pal <- colorRampPalette(c("#FFEA00", "#FF0043"))
colors <- pal(100)
for (i in 1:length(monthyear)) {
png(paste("monthyear", monthyear[i], ".png", sep=""), width=750, height=500)
map("world", col="#191919", fill=TRUE, bg="black", lwd=0.05)
fsub <- flights[flights$month == monthyear[i],]
fsub <- fsub[order(fsub$cnt),]
maxcnt <- max(fsub$cnt)
for (j in 1:length(fsub$month)) {
air1 <- airports[airports$iata == fsub[j,]$airport1,]
air2 <- airports[airports$iata == fsub[j,]$airport2,]
p1 <- c(air1[1,]$long, air1[1,]$lat)
p2 <- c(air2[1,]$long, air2[1,]$lat)
inter <- clean.Inter(p1,p2,n=100, addStartEnd=TRUE)
colindex <- round( (fsub[j,]$cnt / maxcnt) * length(colors) )
lines(inter, col=colors[colindex], lwd=1.0)
}
dev.off()
}
我想自动生成包含所有预定商业路线的大型数据集的地图 - dummy sample - 在ATL和全球网络中的其他机场之间共享(Airports.csv链接到流动数据)后)。我最好每个月制作一张地图,用作描述亚特兰大机场网络空间变化的简短视频中的框架。
问题:我不能让循环产生任何多个PNG - 从每个CSV中的第一个唯一月份 - 每次运行它。我相当肯定Aaron Hardin的代码“打破”自动化,因为它在Flowing Data教程中使用。经过三天的混乱和追逐任何相关的R操作方法后,我意识到我只是缺乏调整与另一个相关的印章。任何人都可以帮助我自动化这个过程吗?
有一篇论文的确认书给你了!
答案 0 :(得分:13)
评论的信息太多,所以我发布了一个答案。这就是我的想法(并在最后阅读以了解可能存在的问题):
我试图在Flowing Data教程中对原始数据运行代码。 (显然你必须为月度数据添加一列,所以我只是添加这一行来随机化月份:):
airports <- read.csv("http://datasets.flowingdata.com/tuts/maparcs/airports.csv",
header=TRUE)
flights <- read.csv("http://datasets.flowingdata.com/tuts/maparcs/flights.csv",
header=TRUE, as.is=TRUE)
# Add column with random data for month
flights$month <- sample(month.abb[1:4], nrow(flights), replace=TRUE)
每当我有一个需要很长时间才能运行的循环时,我通常会在那里粘贴一些代码来给我一个进度检查。使用您喜欢的内容:print
,cat
,tcltk::tkProgressBar
。我使用message
:
for (i in 1:length(monthyear)) {
message(i)
#
# your code here
#
}
无论如何,我随后运行了你的代码。一切都完全正常。由于我采样了四个月的数据,我得到了:
png
图,每个图都有一个黑色的世界地图和明亮的黄色线条。以下是四行之一:
那么,为什么它在我的机器上运行而不在你的机器上呢?
我只能猜测,但我的猜测是你没有设置工作目录。您的代码中没有setwd
,对png
的调用只提供了文件名。我怀疑你的代码是写在你系统中的工作目录中的。
默认情况下,在我的安装中,工作目录为:
getwd()
[1] "C:/Program Files/eclipse 3.7"
要解决此问题,请执行以下操作之一:
setwd()
将工作目录设置在脚本的顶部。png()