Question

我有很多csv文件，我需要阅读所有这些文件并在变量中执行一些操作。我使用了“for循环”，但是花了太长时间。我在这里搜索了许多答案，我知道lapply会更有效率，但我无法实现。有人可以帮帮我吗？文件示例是：

ID  Estimate       SE        avar    h2 
683 6.17E-02       1.226     1.11   0.19
52  -1.77E-02      1.278    1.11    0.19

我有近50个相同格式的文件，但名称不同。我想要做的是读取所有文件，创建一个名为rel的变量，它是：1 - （SE ^ 2）/ avar。之后，我想基于变量rel对数据进行子集化并编写新文件。我试过的是：

 myfiles <- list.files(pattern=".csv")

    for (j in 1:length(myfiles)) {
        this_file <- read.csv(myfiles[j], header = T)
        for (i in this_file) {
               for (k in 1:dim(this_file)){
              this_file["rel"] = 1-((this_file["SE"]*this_file["SE"])/this_file["avar"])
              this_file <- subset(this_file, this_file["rel"] >= 0.8*this_file["h2"])

      write.csv(this_file, file=this_file)
    }}}

我知道这很简单，但我没有得到它。任何帮助将非常感谢。谢谢。保

Answer 1

这应该让你接近。我将使用一个新的文件名向量，因此我们不会覆盖您当前的文件。

myfiles <- list.files(pattern = "\\.csv$")

## make a vector of new file names 'cat*.csv' where * is 1:length(myfiles)
newfiles <- sprintf("cat%d.csv", seq_along(myfiles))

Map(function(x, y) {
        df <- read.table(x, header = TRUE)
        df$rel <- with(df, 1 - (SE^2 / avar))
        write.table(df[df$rel >= (0.8 * df$h2), ], file = y)
    }, x = myfiles, y = newfiles)

将循环更改为几个文件的lapply

1 个答案: