我有一个data.frame
和一个matrix
,其行和列数相同。
matrix
中的所有元素都是整数,但data.frame
包含某些列中的字符。
我想链接这些文件的行,即如果我删除matrix
中的一行,data.frame
中的同一行会被自动删除,或者我对{{1}的元素进行排序使用其中一个列,矩阵中的元素将相应地进行排序。
添加注释:我想将data.frame
保留为整数矩阵,因此我无法使用matrix
。
答案 0 :(得分:1)
至少有两种解决方案。简单的选择是创建一个新的data.frame
,其中包含两行:
示例数据
set.seed(123)
df <- data.frame(ID = 1:26, Group = sample(c("A", "B"), 26, TRUE))
mat <- matrix(rnorm(78), ncol = 3, dimnames = list(1:26, paste0("Val", 1:3)))
创建新的data.frame
,存储矩阵列的名称以供日后参考:
new_df <- cbind(df, mat)
mat_cols <- colnames(mat)
做一些子集:
new_df <- new_df[seq(1, 25, 2), ]
在需要时提取矩阵:
as.matrix(new_df[, mat_cols])
另一种选择是使用S3或S4类。例如,Bioconductor包Biobase
有一个ExpressionSet
类,它可以保存matrix
和表型数据,并且子集化工作可以对两者进行子集化(尽管矩阵的行和列是相反的)方式)。
如果你想更简单地做到这一点(ExpressionsSet
s可能相对复杂,那么这就是S3的实现:
as.JoinedUp <- function(data_frame, matrix) {
stopifnot(is.data.frame(data_frame), is.matrix(matrix), nrow(data_frame) == nrow(matrix))
x <- list(data_frame = data_frame, matrix = matrix)
class(x) <- "JoinedUp"
x
}
`[.JoinedUp` <- function(x, i = NULL, j = NULL) {
if (is.null(i)) {
i <- 1:nrow(x$data_frame)
}
if (is.null(j)) {
j <- union(colnames(x$data_frame), colnames(x$matrix))
}
stopifnot(is.character(j))
x$data_frame <- x$data_frame[i, intersect(j, colnames(x$data_frame)), drop = FALSE]
x$matrix <- x$matrix[i, intersect(j, colnames(x$matrix)), drop = FALSE]
x
}
`[<-.JoinedUp` <- function(x, i = NULL, j = NULL, value) {
if (is.null(j)) {
j <- union(colnames(x$data_frame), colnames(x$matrix))
}
if (is.null(i)) {
i <- 1:nrow(x$data_frame)
}
stopifnot(is.character(j))
if (!is.matrix(value) & !is.data.frame(value)) {
value <- as.data.frame(t(value), stringsAsFactors = FALSE)
}
stopifnot(ncol(value) == length(j))
if (any(j %in% colnames(x$data_frame))) {
df_cols <- intersect(j, colnames(x$data_frame))
x$data_frame[i, df_cols] <- value[, match(df_cols, j)]
}
if (any(j %in% colnames(x$matrix))) {
mat_cols <- intersect(j, colnames(x$matrix))
x$matrix[i, mat_cols] <- data.matrix(value[, match(mat_cols, j)])
}
x
}
示例:
new_obj <- as.JoinedUp(df, mat)
new_obj[1:3, ]
new_obj[, c("ID", "Val1")]
new_obj[10:15, ]$matrix
new_obj <- new_obj[order(new_obj$matrix[, "Val1"]), ]
new_obj[1:5, c("ID", "Val1")] <- data.frame(ID = 20:24, Val1 = 0)
这只是你需要的骷髅;您可能还想为dim
,nrow
,ncol
等定义方法。
答案 1 :(得分:0)
试试这个例子:
#dummy data
set.seed(123)
df1 <- data.frame(ID=1:3, x=letters[1:3])
m1 <- matrix(c(1:3,runif(6)), ncol=3)
#cbind data.frame and matrix, results in a data.frame object
res <- cbind(df1, m1)
res
# ID x 1 2 3
# 1 1 a 1 0.2875775 0.8830174
# 2 2 b 2 0.7883051 0.9404673
# 3 3 c 3 0.4089769 0.0455565
#subset 2nd row
res[ 2,]
# ID x 1 2 3
# 2 2 b 2 0.7883051 0.9404673
#order by 4th column
res[ order(res[ ,4 ]), ]
# ID x 1 2 3
# 1 1 a 1 0.2875775 0.8830174
# 3 3 c 3 0.4089769 0.0455565
# 2 2 b 2 0.7883051 0.9404673