在R

时间:2017-07-11 03:50:30

标签: r

我正在尝试修改R中的一堆excel文件。我正在尝试将数据集名称传递给read_excel,如下所示。

for(title in c("ABC.xlsx", "DEF.xlsx")){

    library(readxl)
    data_a <- read_excel(paste("Directory/","\"", title,"\"", sep=""))
    data_a1 <- data_a[which(data_a$column_1!='NA'),]
}

我收到一条错误消息:

Error: 'Directory/"ABC.xlsx"' does not exist.

所以我想我明白我没有正确使用转义双引号,但我尝试了一些不同的方法来解决它,我无法弄明白。我真的只想循环一些函数来修改我的数据,然后输出一些简单的统计数据。任何帮助都会很棒。感谢。

2 个答案:

答案 0 :(得分:0)

请在粘贴中删除“\”“,然后文件路径将是'Directory / ABC.xlsx'而不是'Directory /”ABC.xlsx“'。

答案 1 :(得分:-1)

您只需要data_a1一次,通常位于代码的最顶层。 另请注意,library(readxl) for(title in c("ABC.xlsx", "DEF.xlsx")){ data_a <- read_excel(paste("Directory/", title, sep="")) data_a1 <- data_a[which(data_a$column_1!='NA'),] } 将在第二次读取时被覆盖。所有你得到的是&#34; DEF.xlsx&#34;数据。

Library(readxl)
data_a1 <- data.frame() # make an empty data frame
for(title in c("ABC.xlsx", "DEF.xlsx")) {
data_a <- read_excel(paste("Directory/", title, sep=""))
data_a1 <- rbind(data_a1, data_a) # assuming they have the same number of columns
}
data_a1 <- data_a1[which(data_a1$column_1 != NA),] # or "NA" if that is really present

我认为你真正想要的是这个

String: AGGTGAACGCCACGTCCAAAGTTAGGTGATGCATTCAAGTT
sub1: GAACGCCACGTCCAAA
sub2: GAACGCCACGTCCAAG