我有一个以下格式的数据集,想要为每个组合提取数据值,如A_ALL,B_ALL,A_Part,B_part进行静态分析。
目前,我能做的是
A_ALL <- data[data$variable=="All" & data$Set=="A",1]
A_Part <- data[data$variable=="Part" & data$Set=="A",1]
我想知道是否有更有效的方法来提取所有这些数据。
谢谢!
陈彤** 输入文件格式 **
value variable Set
24.4003 All A
21.2582 All A
1.91043 All A
34.9642 All B
33.794 All B
16.6093 All B
16.6095 All B
24.4003 Part A
21.2582 Part A
34.9642 Part B
33.794 Part B
16.6093 Part B
答案 0 :(得分:0)
您可以使用split
,这会创建您感兴趣的list
个值:
with(mydf[mydf$Set == "A", ], split(value, variable))
# $All
# [1] 24.40030 21.25820 1.91043
#
# $Part
# [1] 24.4003 21.2582
在这里,我不是拆分整个数据集,而是分割Set == "A"
的值,正如您在当前解决方案中指出的那样。
或者,如果你想一次性根据“Set”和“variable”的所有因素进行分割:
with(mydf, split(value, list(Set, variable)))
# $A.All
# [1] 24.40030 21.25820 1.91043
#
# $B.All
# [1] 34.9642 33.7940 16.6093 16.6095
#
# $A.Part
# [1] 24.4003 21.2582
#
# $B.Part
# [1] 34.9642 33.7940 16.6093
我建议坚持list
,正如我上面创建的那样。但是,如果确实希望在工作区中拥有大量对象,则可以使用list2env
将列表项提取到您的环境中:
## I currently only have the original data.frame
ls()
# [1] "mydf"
list2env(with(mydf, split(value, list(Set, variable))), envir=.GlobalEnv)
# <environment: R_GlobalEnv>
ls()
# [1] "A.All" "A.Part" "B.All" "B.Part" "mydf"
A.All
# [1] 24.40030 21.25820 1.91043
A.Part
# [1] 24.4003 21.2582
B.All
# [1] 34.9642 33.7940 16.6093 16.6095
B.Part
# [1] 34.9642 33.7940 16.6093