尝试将函数应用于R中的数据帧行的错误

时间:2016-12-30 21:25:17

标签: r function vectorization

我编写了一个非常简单的函数(效果很好),它返回给定一组坐标的时区:

library(XML)
findTZ <- function(lon, lat, date=Sys.Date())
{ apiurl <- sprintf("https://maps.googleapis.com/maps/api/timezone/%s?location=%s,%s&timestamp=%d&sensor=%s", 
                    "xml", lat, lon, as.numeric(as.POSIXct(date)), "false")
  TZ <- xmlParse(readLines(apiurl))[["string(//time_zone_id)"]]
  return(TZ)
}

findTZ(-112.86, 53.61) # example

但是,当我尝试在数据框中的坐标列表上运行该函数时,我收到错误:Error in file(con, "r") : invalid 'description' argument

我在这里错了什么提示?看起来应该很简单。

以下是我正在测试的基本数据:

DF <- data.frame(
  longitude = c(-122, -112, -102),
  latitude = c(54, 53, 52)
)

DF$timezone = findTZ(lon=DF$longitude, lat=DF$latitude)

感谢您的任何指示!

编辑/添加

在实现@ Floo0的答案之后,我尝试使用另一个函数实现相同的解决方案,使用相同的位置数据计算日出/设置时间(我想在本地时间返回,因此时区函数)。

这是日出功能:

    library(maptools)
SSun <- function(lon, lat, date, deg=0, dir, tzone)
{ # deg = solar depth: rise/set=0, civil=6, nautical=12, astronomical=18
  # dir = direction: sunrise="dawn", sunset="dusk"
  # tzone  = time zone of output, NOT of location
  siteX <- SpatialPoints(matrix(c(lon, lat), nrow=1), proj4string=CRS("+proj=longlat +datum=WGS84"))
  dateX <- as.POSIXct(date, tz=tzone)
  duskX <- crepuscule(siteX, dateX, solarDep=deg, direction=dir, POSIXct.out=TRUE)
  duskX <- duskX$time # keep only date and time, discard day_frac
  return(duskX)
}

SSun(-112.86, 53.61, "2016-09-25", deg=0, dir="dawn", tzone="America/Edmonton") # example

更新的时区功能:

library(tidyverse); library(xml2)
findTZ <- function(lon, lat, date=Sys.Date()){ 
  apiurl <- sprintf("https://maps.googleapis.com/maps/api/timezone/%s?location=%s,%s&timestamp=%d&sensor=%s", 
                    "xml", lat, lon, as.numeric(as.POSIXct(date)), "false")
  read_xml(apiurl) %>% xml_find_first(".//time_zone_id") %>% xml_text
}

findTZ(-112.86, 53.61) # example

我用来调用这两个函数的代码:

DF %>% mutate(date = as.POSIXct(date),
              TZ = map2_chr(longitude, latitude, findTZ),
              sunrise = SSun(longitude, latitude, date, deg=0, dir="dawn", tzone=TZ))

我觉得我必须误解这是如何运作的。任何见解?

2 个答案:

答案 0 :(得分:1)

您可以执行以下操作(使用xml2代替XML,因为我觉得它更容易使用)

require(xml2)
findTZ <- function(lon, lat, date=Sys.Date()){ 
  apiurl <- sprintf("https://maps.googleapis.com/maps/api/timezone/%s?location=%s,%s&timestamp=%d&sensor=%s", 
                    "xml", lat, lon, as.numeric(as.POSIXct(date)), "false")
  read_xml(apiurl) %>% xml_find_first(".//time_zone_id") %>% xml_text
}

要循环测试数据,您可以使用:

require(tidyverse)
DF %>% mutate(TZ = map2_chr(longitude, latitude, findTZ))

这给了你:

  longitude latitude                TZ
1      -122       54 America/Vancouver
2      -112       53  America/Edmonton
3      -102       52    America/Regina

正如@Rich Scriven指出的那样,你需要在某处循环访问数据。这个循环是&#34;隐藏&#34;在map2_chr电话中。

答案 1 :(得分:1)

考虑mapply将每对元素值传递给函数以返回向量:

DF$timezones <- mapply(findTZ, DF$longitude, DF$latitude)