在下面的代码中,我试图遍历csv文件并计算每个文件的两列之间的相关性。结果存储在空载体中。
例如:第一个文件的名称为“001.csv”。 for循环将计算第2列和第3列之间的相关性,并将其存储在结果向量的第1个位置。这将继续迭代,直到循环结束。
由于某种原因,以下错误不断发生:
Error in file(file, "rt") : invalid 'description' argument
我要执行的代码是:
corr <- function(directory, threshold = 0) {
## defining the directory
path = paste("C:/Users/name/Desktop/R/R Working Directory/",directory,"/", sep="", collapse="")
directory1 <- dir(path, pattern=".csv")
data.set <- complete(directory,) ##calling in the dataset to find correlation on
data.setDIM <- dim(data.set) ##using the dim to filter data in for loop
filter.data <- data.frame(matrix(,,2))
result <- vector()
for(i in i:data.setDIM[1])
{ if( data.set[i,2] >= threshold)
{ filter.data[i,1]<-data.set[i,1]
filter.data[i,2]<-data.set[i,2] }
}
filter.data <- na.omit(filter.data) ##removing the NA values
## Performing corr() function. I will use the 1st column of filter.data to identify the files to read and perform calc on.
for(j in c(filter.data[1]))
{ file <- na.omit(read.csv(paste(path,directory1[j],sep="",colapse="")))
result[j] <- cor(file[2],file[3])
}
result
}
c(filter.data[1])
给了我一个我要索引的整数向量。我在下面打印了一个例子。
[1] 21 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
[19] 41 44 45 47 49 50 51 52 53 54 55 56 57 58 59 60 61 62
[37] 63 64 66 67 68 71 72 74 75 76 77 78 80 83 84 86 87 88
[55] 89 91 93 94 96 97 98 99 103 104 105 108 109 110 111 112 113 114
[73] 115 116 117 119 120 121 122 123 124 125 127 128 131 132 133 136 138 139
[91] 140 141 142 143 144 145 147 148 149 150 151 152 153 154 156 158 160 164
[109] 165 166 167 168 170 171 172 173 174 176 177 178 179 180 181 182 183 184
[127] 185 186 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203
[145] 205 209 210 213 214 215 216 217 218 219 220 221 222 223 225 227 228 229
[163] 230 231 232 234 239 240 241 242 243 244 245 246 247 248 249 250 252 253
[181] 254 255 257 258 260 262 263 265 266 267 268 269 270 271 272 273 277 279
[199] 287 299 300 301 302 303 305 306 307 309 310 312 313 314 315 318 320 321
[217] 322 325 326 327 328 329 330 331