test.data <- data.frame(a=seq(10),b=rep(seq(5),times=2),c=rep(seq(5),each=2))
test.data <- data.frame(lapply(test.data, as.character), stringsAsFactors = F)
test.ref <- data.frame(original=seq(10),name=letters[1:10])
test.ref <- data.frame(lapply(test.ref, as.character), stringsAsFactors = F)
test.match <- function (x) {
result = test.ref$name[which(test.ref$original == x)]
return(result)
}
> data.frame(lapply(test.data, test.match))
a b c
1 a a a
2 b b a
3 c c a
4 d d a
5 e e a
6 f a a
7 g b a
8 h c a
9 i d a
10 j e a
> lapply(test.data, test.match)
$a
[1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j"
$b
[1] "a" "b" "c" "d" "e"
$c
[1] "a"
大家好,
我正在学习在R中使用申请家庭。但是,我陷入了一个相当简单的练习。以上是我的代码。我试图使用“test.match”函数来替换“test.dref”中“test.ref”中的引用规则中的所有元素。但是,如果我将最终结果转换为数据框,则最后一列不起作用。如果我将结果保留为列表,那就更糟了。
非常感谢你的帮助,
凯文
答案 0 :(得分:0)
如评论中所述,您可能需要match
:
do.test.match.df <- function(df, ref_df = test.ref){
res <- df
res[] <- lapply(df, function(x) ref_df$name[ match(x, ref_df$original) ])
return(res)
}
do.test.match.df(test.data)
给出了
a b c
1 a a a
2 b b a
3 c c b
4 d d b
5 e e c
6 f a c
7 g b d
8 h c d
9 i d e
10 j e e
这是惯用的方式。 lapply
将始终返回香草列表。 data.frame是一种特殊的列表(列向量列表)。使用res[] <- lapply(df, myfun)
,我们将分配给res
。
由于您的所有列都是同一个类,我建议使用矩阵而不是data.frame。
test.mat <- as.matrix(test.data)
do.test.match <- function(mat, ref_df=test.ref){
res <- matrix(, nrow(mat), ncol(mat))
res[] <- ref_df$name[ match( c(mat), ref_df$original ) ]
return(res)
}
do.test.match(test.mat)