我有多个CSV文件,其中包含如下结构的数据:
A,B,C,D,
1,2,3,4,
5,6,7,8,
9,10,11,12,
使用蒙特卡罗方法生成的。为了对数据进行一些统计分析,我需要在每个文件中的同一列中的所有数据,在一个矩阵中(即,在一个矩阵中的多个文件中来自列A
的所有数据) 。我知道如何通过使用循环强制执行此操作来实现此目的,但是在R中执行此操作是否更容易?
示例数据:
A <- c(1,5,9)
B <- c(2,6,10)
C <- c(3,7,11)
D <- c(4,8,12)
data <- data.frame(A,B,C,D)
答案 0 :(得分:1)
我建议将所有CSV文件中的数据存储在list
;然后,您可以使用sapply
提取相关列,并将结果列存储在matrix
:
# Sample data
df <- read.csv(text =
"A,B,C,D,
1,2,3,4,
5,6,7,8,
9,10,11,12,", header = T)
# Store data in a list
lst <- list(df, df);
# Extract column A and store as matrix by `cbind`ing entries
cbind(sapply(lst, function(x) x$A))
# [,1] [,2]
#[1,] 1 1
#[2,] 5 5
#[3,] 9 9
或者对列A
,B
,C
,D
一次性执行此操作:
lapply(c("A", "B", "C", "D"), function(s)
cbind.data.frame(sapply(lst, function(x) x[s])))
#[[1]]
# A A
#1 1 1
#2 5 5
#3 9 9
#
#[[2]]
# B B
#1 2 2
#2 6 6
#3 10 10
#
#[[3]]
# C C
#1 3 3
#2 7 7
#3 11 11
#
#[[4]]
# D D
#1 4 4
#2 8 8
#3 12 12