跨越matricies将多个列提取到R中的新矩阵

时间:2018-04-16 02:29:13

标签: r dataframe

我有多个CSV文件,其中包含如下结构的数据:

A,B,C,D,
1,2,3,4,
5,6,7,8,
9,10,11,12,
使用蒙特卡罗方法生成的

。为了对数据进行一些统计分析,我需要在每个文件中的同一列中的所有数据,在一个矩阵中(即,在一个矩阵中的多个文件中来自列A的所有数据) 。我知道如何通过使用循环强制执行此操作来实现此目的,但是在R中执行此操作是否更容易?

示例数据:

A <- c(1,5,9)
B <- c(2,6,10)
C <- c(3,7,11)
D <- c(4,8,12) 
data <- data.frame(A,B,C,D)

1 个答案:

答案 0 :(得分:1)

我建议将所有CSV文件中的数据存储在list;然后,您可以使用sapply提取相关列,并将结果列存储在matrix

# Sample data
df <- read.csv(text =
    "A,B,C,D,
1,2,3,4,
5,6,7,8,
9,10,11,12,", header = T)

# Store data in a list
lst <- list(df, df);

# Extract column A and store as matrix by `cbind`ing entries
cbind(sapply(lst, function(x) x$A))
#     [,1] [,2]
#[1,]    1    1
#[2,]    5    5
#[3,]    9    9

或者对列ABCD一次性执行此操作:

lapply(c("A", "B", "C", "D"), function(s)
    cbind.data.frame(sapply(lst, function(x) x[s])))
#[[1]]
#  A A
#1 1 1
#2 5 5
#3 9 9
#
#[[2]]
#   B  B
#1  2  2
#2  6  6
#3 10 10
#
#[[3]]
#   C  C
#1  3  3
#2  7  7
#3 11 11
#
#[[4]]
#   D  D
#1  4  4
#2  8  8
#3 12 12