我查看了问题数据库,但我找不到答案,很抱歉,如果我错过了什么。 问题很简单:如何根据另一个的列ID创建新的数据框?
如果在原来的df:
structure(list(ID = structure(c(12L, 12L, 12L, 12L, 12L, 12L,
12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 13L, 13L, 13L,
13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L,
13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L), .Label = c("B0F",
"B12T", "B1T", "B21T", "B22F", "B26T", "B2F", "B33F", "B3F",
"B4F", "B7F", "P1", "P21", "P24", "P25", "P27", "P28", "P29"), class = "factor"),
EC = c(953L, 838L, 895L, 2170L, 2140L, 1499L, 2120L, 881L,
902L, 870L, 541L, 891L, 876L, 860L, 868L, 877L, 3630L, 3400L,
2470L, 2330L, 1810L, 2190L, 2810L, 2200L, 2440L, 1111L, 2460L,
2210L, 2340L, 1533L, 880L, 2475L, 2350L, 2440L, 1456L, 2320L,
2220L, 2990L, 2240L, 2210L, 2630L)), .Names = c("ID", "EC"
), row.names = 40:80, class = "data.frame")
如何基于ID创建两个新的df?所以我可以有两个名为B21T和P1的新df吗? 我知道我可以使用子集来完成它,但如果我有很多ID,则需要花费很多时间。
所以我认为我正在寻找的是一种自动化子集功能的方法。
答案 0 :(得分:1)
考虑df
是您的data.frame,然后执行:
df$ID <- droplevels(df$ID) # drop unused levels from `ID`
list2env(split(df, df$ID), envir=.GlobalEnv)
答案 1 :(得分:0)
您可以将所需的所有子集放在list
中,然后从那里提取它们:
#DF <- structure(list(ID = structure(c(12L ...
#all different "ID"s
ids <- as.character(unique(DF$ID))
#create empty list to insert all different subsets
myls <- vector("list", length(ids))
#insert the different subsets
for(i in 1:length(ids))
{
myls[[i]] <- DF[DF$ID == ids[i],]
}
names(myls) <- ids
您可以访问所需的数据框:
> myls$P21
ID EC
56 P21 3630
57 P21 3400
...
> myls$P1
ID EC
40 P1 953
41 P1 838
...
如果您有很多“ID”,这可能需要一些时间。
修改强>
Waaay优于for
循环是Jilber的答案。这里用作split(DF, DF$ID, drop = T)
。