阅读嵌入网站的Excel文件

时间:2017-01-24 15:58:12

标签: r excel

我想在R中自动读取位于

的文件

https://clients.rte-france.com/servlets/IndispoProdServlet?annee=2017

此链接生成zipfile的自动下载。这个zipfile包含我想用R读取的Excel文件。

你们有什么建议吗?谢谢。

1 个答案:

答案 0 :(得分:0)

Panagiotis'使用download.file()的评论通常是很好的建议,但我无法在这里工作(并且很想知道为什么)。相反,我使用了httr (编辑:得到它,我颠倒了download.file()的args ...在我之后重复:总是使用命名的args ......)

此数据的另一个问题是:它似乎不是常规xls文件,我无法使用优秀的readxl包打开它。 看起来像一个标签分隔的平面文件,但read.table()也没有成功。 readr::read_delim()成功了。

library(httr)
library(readr)
r <- GET("https://clients.rte-france.com/servlets/IndispoProdServlet?annee=2017")
# Write the archive on disk
writeBin(r$content, "./data/rte_data")
rte_data <- 
  read_delim(
    unzip("./data/rte_data", exdir = "./data/"),
    delim = "\t",
    locale = locale(encoding = "ISO-8859-1"),
    col_names = TRUE
  )

仍然存在解析问题,但不确定是否应该在这个问题中处理它们。