我想在R中自动读取位于
的文件https://clients.rte-france.com/servlets/IndispoProdServlet?annee=2017
此链接生成zipfile的自动下载。这个zipfile包含我想用R读取的Excel文件。
你们有什么建议吗?谢谢。
答案 0 :(得分:0)
Panagiotis'使用download.file()
的评论通常是很好的建议,但我无法在这里工作(并且很想知道为什么)。相反,我使用了httr
(编辑:得到它,我颠倒了download.file()
的args ...在我之后重复:总是使用命名的args ......)
此数据的另一个问题是:它似乎不是常规xls
文件,我无法使用优秀的readxl
包打开它。
看起来像一个标签分隔的平面文件,但read.table()
也没有成功。 readr::read_delim()
成功了。
library(httr)
library(readr)
r <- GET("https://clients.rte-france.com/servlets/IndispoProdServlet?annee=2017")
# Write the archive on disk
writeBin(r$content, "./data/rte_data")
rte_data <-
read_delim(
unzip("./data/rte_data", exdir = "./data/"),
delim = "\t",
locale = locale(encoding = "ISO-8859-1"),
col_names = TRUE
)
仍然存在解析问题,但不确定是否应该在这个问题中处理它们。