我正在尝试将此.xls文件导入R:https://www.reit.com/sites/default/files/returns/MonthlyHistoricalReturns.xls
我尝试将其直接从Windows计算机上的URL引入。我已经遇到过https和http问题以及Windows的perl问题。为了解决这个问题,我尝试在ubuntu上运行以及首先下载文件。
我最近两次尝试使用readxl和gdata都会产生一个数据帧,尽管其中没有任何数据。没有错误消息。
NAREIT <- readxl::read_xls("~/Downloads/MonthlyHistoricalReturns.xls")
这将产生对一个变量(全为NA)的38个观测值。
NAREIT <- gdata::read.xls("~/Downloads/MonthlyHistoricalReturns.xls")
这将产生1个变量的0个观测值,“表中没有可用数据”是唯一单元格中写入的文本。
该文件非常丑陋,有多个不需要的标题行,合并的单元格,冻结的视图等。我尝试指定范围,列,行,要跳过的行,列名等-我能想到的所有内容来自readxl和gdata文档。
我可以剪切所需的范围,另存为CSV并使用它。但是,由于我可能不得不定期回到此状态,因此我正在寻找打开该文件的“正确”方法。任何想法都很感激。
答案 0 :(得分:2)
看起来好像有几行标题,所以您需要弄清楚您想要的标题是什么,或者实际上查阅堆栈溢出中的几页,向您展示如何处理2行标题。
无论如何,我可以这样导入它,看起来还可以
library(readxl)
MonthlyHistoricalReturns <- read_excel("MonthlyHistoricalReturns.xls", sheet = "Index Data", skip = 7)
我跳到了第7行以在此处开始标题