从reshape2中的melt输出中提取数据值

时间:2013-09-03 02:55:07

标签: r reshape2 melt

我有一个以下格式的数据集,想要为每个组合提取数据值,如A_ALL,B_ALL,A_Part,B_part进行静态分析。

目前,我能做的是

A_ALL <- data[data$variable=="All" & data$Set=="A",1]
A_Part <- data[data$variable=="Part" & data$Set=="A",1]

我想知道是否有更有效的方法来提取所有这些数据。

谢谢!

陈彤

** 输入文件格式 **

value   variable    Set
24.4003 All A
21.2582 All A
1.91043 All A
34.9642 All B
33.794  All B
16.6093 All B
16.6095 All B
24.4003 Part    A
21.2582 Part    A
34.9642 Part    B
33.794  Part    B
16.6093 Part    B

1 个答案:

答案 0 :(得分:0)

您可以使用split,这会创建您感兴趣的list个值:

with(mydf[mydf$Set == "A", ], split(value, variable))
# $All
# [1] 24.40030 21.25820  1.91043
# 
# $Part
# [1] 24.4003 21.2582

在这里,我不是拆分整个数据集,而是分割Set == "A"的值,正如您在当前解决方案中指出的那样。


或者,如果你想一次性根据“Set”和“variable”的所有因素进行分割:

with(mydf, split(value, list(Set, variable)))
# $A.All
# [1] 24.40030 21.25820  1.91043
# 
# $B.All
# [1] 34.9642 33.7940 16.6093 16.6095
# 
# $A.Part
# [1] 24.4003 21.2582
# 
# $B.Part
# [1] 34.9642 33.7940 16.6093

我建议坚持list,正如我上面创建的那样。但是,如果确实希望在工作区中拥有大量对象,则可以使用list2env将列表项提取到您的环境中:

## I currently only have the original data.frame
ls()
# [1] "mydf"
list2env(with(mydf, split(value, list(Set, variable))), envir=.GlobalEnv)
# <environment: R_GlobalEnv>
ls()
# [1] "A.All"  "A.Part" "B.All"  "B.Part" "mydf"  
A.All
# [1] 24.40030 21.25820  1.91043
A.Part
# [1] 24.4003 21.2582
B.All
# [1] 34.9642 33.7940 16.6093 16.6095
B.Part
# [1] 34.9642 33.7940 16.6093