导入具有多个工作表的Excel工作簿

时间:2018-03-19 09:28:28

标签: r excel xlconnect readxl

我希望将excel工作簿导入到R中,并且有多个工作表。但是,我似乎无法完成这项工作。我一直在使用的代码如下:

library(XLConnect)
# Read Excel Sheet
excel <- loadWorkbook("C:/Users/rawlingsd/Downloads/17-18 Prem Stats.xlsx")
# get sheet names
sheet_names <- getSheets(excel)
names(sheet_names) <- sheet_names
# put sheets into a list of data frames
sheet_list <- lapply(sheet_names, function(.sheet){readWorksheet(object=excel, .sheet)})
# limit sheet_list to sheets with at least 1 dimension 
# sheet_list2 <- sheet_list[sapply(sheet_list, function(x) dim(x)[1]) > 0]
# code to read in each excel worksheet as individual dataframes
for (i in 1:length(sheet_list)){assign(paste0("2018df", i), as.data.frame(sheet_list[i]))}
# define function to clean data in each data frame (updated based on your data)

如果有人可以帮我处理我的代码或分享适合他们的代码,我们将不胜感激

4 个答案:

答案 0 :(得分:3)

我用的是什么:

full_excel_read<-function(fpath,v=TRUE){



 sheetnames <- excel_sheets(fpath)
  workbook <- sapply(sheetnames,function (x){readxl::read_excel(fpath,sheet = x)})
  for (sh in sheetnames) {
    workbook[[sh]]<-as.data.table(workbook[[sh]])
  }
  if (v){
    lapply(sheetnames, function(x){View(workbook[[x]],x)})
  }


  workbook
}

答案 1 :(得分:3)

您可以使用readxl包。请参阅以下示例。

library(readxl)
path <- readxl_example("datasets.xls")
sheetnames <- excel_sheets(path)
mylist <- lapply(excel_sheets(path), read_excel, path = path)

# name the dataframes
names(mylist) <- sheetnames

电子表格将在列表中捕获,其中sheetname作为列表中数据框的名称。

如果您想将数据帧从列表中删除,请使用下一段代码。

# Bring the dataframes to the global environment
list2env(mylist ,.GlobalEnv)

答案 2 :(得分:2)

请查看openxlsx包,它允许您使用excel工作簿完成大量工作。 这是一个代码脚本,用于读取给定工作簿中的所有工作表。

library(openxlsx)
a <- loadWorkbook('~/filename.xlsx')
sheetNames <- sheets(a)
for(i in 1:length(sheetNames))
{
  assign(sheetNames[i],readWorkbook(a,sheet = i))
}

您可以验证数据是否已加载到R中,并且可以在workSpace中查看。

感谢。

答案 3 :(得分:1)

请参阅Read all worksheets in an Excel workbook into an R list with data.frames

require(XLConnect)
wb <- loadWorkbook(system.file("demoFiles/mtcars.xlsx", package = "XLConnect"))
lst <- readWorksheet(wb, sheet = getSheets(wb))

lst是一个命名列表,其名称对应于工作表名称。请注意,readWorksheet是矢量化的,因此您可以通过一次readWorksheet调用来阅读多个工作表。