我有一个excel文件,当我想打开它时会出现以下警告消息:
您尝试打开的文件“name.ext”的格式与文件扩展名指定的格式不同。在打开文件之前,请验证文件是否已损坏且是否来自受信任的源。你想现在打开文件吗?
当我点击是打开它时,一切都很好。但是,我想在R中读取此文件并且无法管理R加载内容尽管有警告。我怎样才能做到这一点?
我想用R打开的文件的一个示例可以下载here.我使用MS Office 2016。
答案 0 :(得分:3)
这是一个XML文件,开头有一个UTF-16 BOM(字节顺序标记)。你可以用R:
阅读library(xml2)
library(rvest)
xls <- read_html("LU0444605991_434.xls")
values <- html_text(html_nodes(xls, xpath="//cell/data"))
dat <- data.frame(matrix(values[5:length(values)], ncol=2, byrow=TRUE),
stringsAsFactors=FALSE)
colnames(dat) <- c("datum", "nav")
dat$nav <- as.numeric(dat$nav)
head(dat)
## datum nav
## 1 2009-10-05T00:00:00 117.1047
## 2 2009-10-06T00:00:00 117.0746
## 3 2009-10-07T00:00:00 117.0915
## 4 2009-10-08T00:00:00 117.0822
## 5 2009-10-09T00:00:00 116.8312
## 6 2009-10-12T00:00:00 116.9347
你可以使用xml2
包(和read_xml
),如果你真的想反复抨击你的头,以处理这些Microsoft文档中疯狂的XML命名空间。
您仍需要进行日期/时间转换和数字转换。