我正在开展一个项目,我需要从“拾取”到“下降”坐标获得最短的距离和时间。 在我的数据集中,我有一个表示“trip_distance”和“pickup_date”的变量,我的任务是计算“trip_distance”变量偏离Google估计距离的数量,并通过控制出发来计算每次旅行所需的时间时间。
以下是我的数据的一小部分示例(其中有大约1.5米的行,我正在尝试找到< 2,500查询限制的方法)
trip_distance pickup_datetime pickup dropoff
1 8.1 2011-01-01 23:13:56 40.77419%2C-73.872608 40.78055%2C-73.955042
2 10.6 2011-01-04 17:12:49 40.7737%2C-73.870721 40.757007%2C-73.971953
3 15.9 2011-01-05 18:41:53 40.773761%2C-73.87086 40.707277%2C-74.007301
代码:
library(ggmap)
rownames(X) <- NULL
res <- mapdist(from= X$pickup,
to = X$dropoff,
mode = "driving" ,
output = "simple", messaging = FALSE, sensor = FALSE,
language = "en-EN", override_limit = FALSE, departure_time= X$pickup_date)
我得到的错误是:
Error in mapdist(from = X$pickup, to = X$dropoff, mode = "driving", output = "simple", : unused argument (departure_time = X$pickup_date)
有没有办法使用mapdist控制流量?
dput(头(X))
structure(list(pickup_datetime = structure(c(1293923636, 1294161169,
1294252913, 1294259376, 1294419723, 1293903309), class = c("POSIXct",
"POSIXt"), tzone = ""), trip_distance = c(8.1, 10.6, 15.9, 8.9,
11.5, 9.6), pickup = c("40.77419,-73.872608", "40.7737,-73.870721",
"40.773761,-73.87086", "40.773776,-73.870908", "40.774161,-73.87302",
"40.774135,-73.8749"), dropoff = c("40.78055,-73.955042", "40.757007,-73.971953",
"40.707277,-74.007301", "40.770568,-73.95468", "40.758284,-73.986621",
"40.758691,-73.961359")), .Names = c("pickup_datetime", "trip_distance",
"pickup", "dropoff"), row.names = c(NA, 6L), class = "data.frame")
答案 0 :(得分:3)
来自mapdist()
的{{1}}函数不会返回流量信息,因为它似乎不构造带有ggmap
和&departure_time=
参数的网址(必须检索流量信息) )
正如Google Maps Distance Matrix API documentation中提到的那样:
对于旅行模式驾驶的请求:您可以指定
key=
接收路线和行程持续时间(响应字段: 考虑到交通状况的departure_time
)。这个 选项仅在请求包含有效的 API密钥或a时才可用 有效的 Google Maps API Premium Plan客户ID和签名。
此外,在您的数据集中,duration_in_traffic
已过去,因此您无法将其用作pickup_date
参数。
departure_time
必须设置为当前时间或某个时间 未来。它不可能在过去。
并且需要数字格式:
您可以将时间指定为自午夜起的整数秒, 1970年1月1日UTC。或者,您可以指定值
departure_time
, 它将出发时间设置为当前时间(对于 最近的第二个)。
话虽这么说,您可以使用所需参数手动构建自己的Google Maps Distance Matrix API请求(请注意,我修改了您的初始数据集,以便将来发生now
)
pickup_datetime
这将为您提供包含所有网址的字符向量APIKEY = ##Your API key goes here##
url_string <- paste0("https://maps.googleapis.com/maps/api/distancematrix/json",
"?origins=", df$pickup,
"&destinations=", df$dropoff,
# convert POSIXct to numeric
"&departure_time=", as.numeric(df$pickup_datetime),
"&traffic_model=best_guess",
"&key=", APIKEY)
。例如,您可以检索第一个条目的信息:
url_string
然后使用以下方式访问交通信息:
connect <- url(url_string[1])
tree <- jsonlite::fromJSON(paste(readLines(connect), collapse = ""),
simplifyDataFrame = FALSE)
给出了:
tree$rows[[1]]$elements[[1]]$duration_in_traffic
数据强>
$text
[1] "17 mins"
$value
[1] 1016
答案 1 :(得分:3)
我已经编写了包googleway来访问google maps API,您可以在其中指定API密钥,因此可以使用API提供的功能(例如出发时间和流量)
但是,为此,您需要使用开发版本,因为我注意到traffic_model
中存在一个小错误。这将在下一个版本中修复。
devtools::install_github("SymbolixAU/googleway")
library(googleway)
key <- "your_api_key"
## data.frame of origin & destination coordiantes
## you can obviously add in a 'pickup' datetime column too,
## but remembering that for Google API it must be in the future
df <- data.frame(orig_lat = c(40.77419, 40.7737, 40.773761),
orig_lon = c(-73.872608, -73.870721, -73.87086),
dest_lat = c(40.78055, 40.757007, 70.707277),
dest_lon = c(-73.955042, -73.971953,-74.007301))
现在,您可以使用首选循环方法获取data.frame每行上每组点之间的距离
例如
lst <- apply(df, 1, function(x) {
google_distance(origins = list(c(x["orig_lat"], x["orig_lon"])),
destinations = list(c(x["dest_lat"], x["dest_lon"])),
departure_time = Sys.time() + (24 * 60 * 60),
traffic_model = "best_guess",
key = key)
})
然后您可以访问返回列表中的数据
lst[[1]]$origin_addresses
# [1] "Central Terminal Dr, East Elmhurst, NY 11371, USA"
lst[[1]]$destination_addresses
# [1] "1294-1296 Lexington Ave, New York, NY 10128, USA"
lst[[1]]$rows$elements
# [[1]]
# distance.text distance.value duration.text duration.value duration_in_traffic.text duration_in_traffic.value status
# 1 12.8 km 12805 21 mins 1278 23 mins 1355 OK