我的Excel文档my.xlsx
有两个名为 Sheet1 和 Sheet2 的工作表。我想使用fread
data.table
包中的R
函数读取Excel工作簿中的所有工作表。下面的代码只是阅读了活动的工作表。想知道如何在不知道其名称的情况下阅读所有工作表。谢谢
df3 <- data.table::fread("in2csv my.xlsx")
> names(df3)
[1] "A" "B"
> df3
A B
1: 1 2
2: 2 4
3: 3 6
4: 4 8
5: 5 10
答案 0 :(得分:2)
我上次需要从XLSX读取许多图纸时使用了openxlsx::read.xlsx
。
#install.packages("openxlsx")
library(openxlsx)
#?openxlsx::read.xlsx
#using file chooser:
filename <- file.choose()
#or hard coded file name:
#filename <- "filename.xlsx"
#get all the sheet names from the workbook
SheetNames<-getSheetNames(filename)
# loop through each sheet in the workbook
for (i in SheetNames){
#Read the i'th sheet
tmp_sheet<-openxlsx::read.xlsx(filename, i)
#if the input file exists, append the new data;; else use the first sheet to initialize the input file
ifelse(exists("input"),
input<-rbind(input, tmp_sheet),
input<-tmp_sheet)
}
注意:假定每个工作表具有相同的列结构和数据类型。您可能需要对数据进行标准化/标准化(例如tmp_sheet <- as.data.frame(sapply(tmp_sheet,as.character), stringsAsFactors=FALSE)
),或将每张工作表加载到其自己的数据框中,并在合并之前进行进一步的预处理。