我正在尝试使用其中一个应用函数来矢量化以下任务,但是徒劳无功。 我有一个列表和一个数据帧。我想要完成的是使用查找列表在数据框中创建子组。
查找列表(基本上是百分位组)如下所示:
Look_Up_List
$`1`
A B C D E
0.000 0.370 0.544 0.698 9.655
$`2`
A B C D E
0.000 0.506 0.649 0.774 1.192
Curret Dataframe看起来像这样:
Score Big_group
0.1 1
0.4 1
0.3 2
结果数据框必须如下所示,并附加一列。它匹配相应Big_Group中查找列表中百分位桶中的分数:
Score Big_group Sub_Group
0.1 1 A
0.4 1 B
0.3 2 A
非常感谢
答案 0 :(得分:1)
您可以创建如下函数:
myFun <- function(x) {
names(Look_Up_List[[as.character(x[2])]])[
findInterval(x[1], Look_Up_List[[as.character(x[2])]])]
}
并apply
按行apply
:
apply(mydf, 1, myFun)
# [1] "A" "B" "A"'
答案 1 :(得分:0)
# reproducible input data
Look_Up_List <- list('1' <- c(A=0.000, B=0.370, C=0.544, D=0.698, E=9.655),
'2' <- c(A=0.000, B=0.506, C=0.649, D=0.774, E=1.192))
Current <- data.frame(Score=c(0.1, 0.4, 0.3),
Big_group=c(1,1,2))
# Solution 1
Current$Sub_Group <- sapply(1:nrow(Current), function(i) max(names(Look_Up_List[[1]][Current$Score[i] > Look_Up_List[[1]] ])))
# Alternative solution (using findInterval, slightly slower at least for this dataset)
Current$Sub_Group <- sapply(1:nrow(Current), function(i) names(Look_Up_List[[1]])[findInterval(Current$Score[i], Look_Up_List[[1]])])
# show result
Current