将具有可变列类型的多个.csv文件导入到R中

时间:2016-11-16 18:57:09

标签: r dplyr tidyverse

如何正确构建lapply以从所有.csv文件中读取(从一个目录中),将所有列作为字符串加载,然后将它们绑定到一个数据框中。

Per this,我有办法将所有.csv文件加载并绑定到数据帧中。不幸的是,他们对这些列如何进行类型转换的可变性感到困惑。因此给我这个错误:

  

错误:无法自动从字符转换为整数   柱

我尝试用arguments for data type补充代码,并尝试将所有内容保留为字符;我现在陷入困境,能够正确地获得我的'lapply'循环'以有效地引用其'循环'的每个循环的主题。

srvy1 <- structure(list(RESPONSE_ID = 584580L, QUESTION_ID = 328L, SURVEY_ID = 2324L, 
           AFF_ID_INV_RESP = 5L), .Names = c("RESPONSE_ID", "QUESTION_ID", 
                                             "SURVEY_ID", "AFF_ID_INV_RESP"), class = "data.frame", row.names = c(NA, 
                                                                                                                  -1L))

srvy2 <- structure(list(RESPONSE_ID = 584580L, QUESTION_ID = 328L, SURVEY_ID = 2324L, 
           AFF_ID_INV_RESP = "bovine"), .Names = c("RESPONSE_ID", "QUESTION_ID", 
                                                   "SURVEY_ID", "AFF_ID_INV_RESP"), class = "data.frame", row.names = c(NA, 
                                                                                                                        -1L))    

files = list.files(pattern="*.csv")
tbl = lapply(files, read_csv(files, col_types = cols(.default = col_character()))) %>% bind_rows

是否有一个简单的解决方法,我可以保持整齐,或者我必须下降一个级别,然后自己公开构建for循环 - 每this

1 个答案:

答案 0 :(得分:8)

lapply应为lapply(x, FUN, ...)格式,其中...是传递给FUN的参数。你在FUN中填充参数。它应该是lapply(files, read_csv, col_types = cols(.default = "c"))

如果您喜欢tidyverse解决方案:

files %>%
  map_df(~read_csv(.x, col_types = cols(.default = "c")))

最终将整个事物绑定到数据框中。