如何阅读在r

时间:2017-02-08 22:52:23

标签: r web-scraping

我正在尝试自动更新R中程序数据的过程。此数据从以下位置下载:  http://obiee.banrep.gov.co/analytics/saw.dll?Download&Format=excel&Extension=.xls&BypassCache=true&Path=/shared/Consulta%20Series%20Estadisticas%20desde%20Excel/1.%20Tasas%20de%20Captacion/1.1%20Serie%20empalmada/1.1.2%20Semanales/1.1.2.1%20DTF,CDT%20180%20d%C3%ADas,CDT%20360%20d%C3%ADas%20y%20TCC%20-%20(Desde%20el%2012%20de%20enero%20de%201984)/Serie%20historica%20IQY&NQUser=publico&NQPassword=publico&SyncOperation=1

问题是该文件被称为保存为.xls(当您下载它时采用该格式)但它实际上是以网页格式(即HTML)保存。我知道它以不正确的格式保存,因为当尝试在RI中读取它时得到错误“您的InputStream既不是OLE2流也不是OOXM”我尝试在excel中手动打开并保存它并且它显示它是实际上是一个网页。

我的代码是: library(RCurl) library(XLConnect) f = CFILE("exfile.xlsx", mode="wb") curlPerform(url = urlDFT, writedata = f@ref, ssl.verifypeer = FALSE) close(f) out = readWorksheetFromFile(file = "exfile.xlsx", sheet =1, header =F)

之前提到urlDTF的地方。当文件处于任何excel格式时,代码完全正常,但不适用于有线文件。

0 个答案:

没有答案