如何在文件格式和文件扩展名不同的R中打开excel文件?

时间:2015-11-19 11:15:17

标签: xml r excel package warnings

我有一个excel文件,当我想打开它时会出现以下警告消息:

您尝试打开的文件“name.ext”的格式与文件扩展名指定的格式不同。在打开文件之前,请验证文件是否已损坏且是否来自受信任的源。你想现在打开文件吗?

当我点击打开它时,一切都很好。但是,我想在R中读取此文件并且无法管理R加载内容尽管有警告。我怎样才能做到这一点?

我想用R打开的文件的一个示例可以下载here.我使用MS Office 2016。

1 个答案:

答案 0 :(得分:3)

这是一个XML文件,开头有一个UTF-16 BOM(字节顺序标记)。你可以用R:

阅读
library(xml2)
library(rvest)

xls <- read_html("LU0444605991_434.xls")
values <- html_text(html_nodes(xls, xpath="//cell/data"))
dat <- data.frame(matrix(values[5:length(values)], ncol=2, byrow=TRUE), 
                  stringsAsFactors=FALSE)
colnames(dat) <- c("datum", "nav")
dat$nav <- as.numeric(dat$nav)

head(dat)
##                 datum      nav
## 1 2009-10-05T00:00:00 117.1047
## 2 2009-10-06T00:00:00 117.0746
## 3 2009-10-07T00:00:00 117.0915
## 4 2009-10-08T00:00:00 117.0822
## 5 2009-10-09T00:00:00 116.8312
## 6 2009-10-12T00:00:00 116.9347

你可以使用xml2包(和read_xml),如果你真的想反复抨击你的头,以处理这些Microsoft文档中疯狂的XML命名空间。

您仍需要进行日期/时间转换和数字转换。