我正在尝试使用reshape2::melt
为长格式数据框添加时变预测器,但我想知道是否有更快的方法来执行此操作。
这是广泛的玩具数据。在不同的访问/时间点采取结果变量(session1,session2和session3)的三个度量。这三次访问之间的持续时间对于每个参与者是不同的,并且最终我想将这些差异归因于模型。
id <- 1:10
group <- rep(c("A", "B"), times = 5)
session1 <- rnorm(10, 5, 1)
session2 <- rnorm(10, 3, 1)
session3 <- rnorm(10, 7, 2)
time1 <- rep(0, 10)
time2 <- rnorm(10, 24, 0.5)
time3 <- rnorm(10, 48, 0.5)
df <- data.frame(id, group, session1, session2, session3, time1, time2, time3)
现在我想转换成一个长格式的数据帧。我使用reshape2::melt
。我可以围绕这样的分数创建这个:
library(reshape2)
dfLong <- melt(df, measure.vars = c("session1", "session2", "session3"), var = "session", value.name = "score")
或我可以围绕时间值创建它。
dfLong2 <- melt(df, measure.vars = c("time1", "time2", "time3"), var = "time", value.name = "timeOut")
但是,如果不进行两次融化并执行某种类似的操作,我就无法做到这两点
dfLong$timeOut <- dfLong2$timeOut
最终我希望数据框看起来像这样
dfLong$time <- rep(c("time1", "time2", "time3"), each = 10)
dfLong <- dfLong[,which(names(dfLong) %in% c("id", "group", "time", "session", "score", "timeOut"))]
dfLong
有没有办法一次融化两个集列?
答案 0 :(得分:3)
我们可以使用data.table
library(data.table)
res = melt(setDT(df), measure = patterns("^session", "^time"),
value.name = c("session", "time"))
如果您现在不想学习如何使用data.tables,则setDF(res)
可以恢复为data.frame。