读取多个.gpx文件

时间:2011-06-18 17:00:50

标签: r loops gps gis

假设我有一些 .gpx 文件(这些文件包含来自Garmin eTrex的GPX航点数据)。我想用不同的名称将它们加载到R中并操纵它们。

我可以读取一个文件:

library(maptools)
gpx.raw <- readGPS(i = "gpx", f = "file1_w_12_f_ddf.gpx", type="w")

假设我想将其中的一些内容读入内存。我可以尝试 for 循环:

files <- list.files(".",pattern = "*.gpx")
for(x in files){

    #Create new file name
    temp <- strsplit(x,"_",fixed=TRUE)
    visit.id <- sapply(temp,FUN=function(x){paste(x[1],x[4],substr(x[5],1,3),sep="_")})

    #read file with new filename
    assign(visit.id, readGPS(i = "gpx", f = x, type="w"))
}

在程序上运行会产生以下错误:

  

read.table出错(con&lt; - textConnection(gpsdata),fill = TRUE,...):     输入中没有可用的行   另外:警告信息:   运行命令'C:\ PROGRA~2 \ GPSBabel \ gpsbabel.exe -w -i gpx -f file1_w_12_f_ddf.gpx -o tabsep -F - '状态为1

请注意,我能够自己读取此文件,因此它似乎与文件本身无关,而是在循环中运行readGPS。

总的来说,我仍然觉得 R 处理上面的 x 等变量非常困惑。我不确定如何从独立实例f = "file1_w_12_f_ddf.gpx"修改readGPS的参数:它应该是xf = x还是f = "x",还是什么?或者问题可能在于对GPSBabel的调用......

我在下面添加了一个示例文件,因此您可以将其复制到文本编辑器中,并使用不同的名称保存为 .gpx。两次并尝试自己。

<?xml version="1.0" encoding="UTF-8"?>
<gpx
 version="1.0"
 creator="GPSBabel - http://www.gpsbabel.org"
 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xmlns="http://www.topografix.com/GPX/1/0"
 xsi:schemaLocation="http://www.topografix.com/GPX/1/0 http://www.topografix.com/GPX/1/0/gpx.xsd">
 <time>2010-09-14T18:35:43Z</time>
 <bounds minlat="18.149888897" minlon="-96.747799935" maxlat="50.982883293" maxlon="121.640266674"/>
<wpt lat="38.855549991" lon="-94.799016668">
<ele>325.049072</ele>
 <name>GARMIN</name>
 <cmt>GARMIN</cmt>
 <desc>GARMIN</desc>
 <sym>Flag</sym>
 </wpt>
 <wpt lat="50.982883293" lon="-1.463899976">
 <ele>35.934692</ele>
 <name>GRMEUR</name>
 <cmt>GRMEUR</cmt>
 <desc>GRMEUR</desc>
 <sym>Flag</sym>
 </wpt>
 <wpt lat="25.061783362" lon="121.640266674">
 <ele>38.097656</ele>
 <name>GRMTWN</name>
 <cmt>GRMTWN</cmt>
 <desc>GRMTWN</desc>
 <sym>Flag</sym>
 </wpt>
 </gpx>

注意:要运行 readGPS ,您需要在PATH变量中安装和引用开源GPSBabel程序。

2 个答案:

答案 0 :(得分:6)

佛瑞德,

安装GPSBabel并更新PATH变量后,您的代码段运行正常。我有两个对象名test1.gpx_NA_NAtest2.gpx_NA_NA,有三个28个变量的观察值。是对的吗?我假设文件名中的NA位是由于您如何定义visit.id而我的测试文件名不符合该范例。

你是否在一个新的R实例上试过这个?

FWIW,我可能会将所有这些文件读入一个列表对象。我发现处理列表对象比放置许多不同的对象更容易。例如,

files <- dir(pattern = "\\.gpx")
#Replace all space characters with a "_". Replace with the character of your choice.
lapply(files, function(x) file.rename(from = x, to = gsub("\\s+", "_", x)))

#Reread in files with better names:
files <- dir(pattern = "\\.gpx")
out <- lapply(files, function(x) readGPS(i = "gpx", f = x, type = "w"))
names(out) <- files

out现在是2的列表,其中每个对象都是一个data.frame,其中包含与之前关联的文件的名称。使用来自*apply家庭的东西也有利于留下干净的工作空间。使用for-loop会导致xtempvisit.id挂断后跟。你可以将它们包装成一个函数调用,但我认为只使用lapply会更直接。

答案 1 :(得分:4)

原来代码很好,问题在于文件名。 GPSBabel不喜欢带有空格的名字。所以“1_SanJoséBaldi_Pernam_14_sep.gpx”是一个问题,“1_San_José_Baldi_Pernam_14_sep.gpx”不是。