问题:我想在数据框中添加三列,每一列都是一个数字序列。但是我希望每一列都与另一列有所不同。因此,这是一个示例数据框:
data <- read.table(text="
group1 group2 rate
A D 0.01
A D 0.001
A D 0.0001
B D 0.01
B D 0.001
B D 0.0001
D A 0.01
D A 0.001
D A 0.0001
D B 0.01
D B 0.001
D B 0.0001",
header=TRUE)
因此,首先我扩展了数据框,以容纳3列所需的数字组合。我使用125是因为每个序列有5个数字。
dataext <- data[rep(seq_len(nrow(data)), 125), ]
然后,我使用所需的数字序列创建了新列:
dataext$var1 <- rep_len (seq(0,1, 0.25), length.out=125)
dataext$var2 <- rep_len (seq(0,1, 0.25), length.out=125)
dataext$var3 <- rep_len (seq(0,1, 0.25), length.out=125)
我想要的输出示例:
group1 group2 rate var1 var 2 var3
A D 0.01 0 0 0
A D 0.001 0 0 0
A D 0.0001 0 0 0
A D 0.01 0.25 0 0
A D 0.001 0.25 0 0
A D 0.0001 0.25 0 0
A D 0.01 0.25 0.25 0
A D 0.001 0.25 0.25 0
A D 0.0001 0.25 0.25 0
A D 0.01 0.25 0.25 0.25
A D 0.001 0.25 0.25 0.25
A D 0.0001 0.25 0.25 0.25
我希望这足够清楚。任何有关如何正确做到这一点的线索都将不胜感激。谢谢!
答案 0 :(得分:0)
我无法发表任何评论要求澄清,但似乎您希望在group1,group2,rate,var1,var2和var3之间进行所有组合。
您可以使用expand.grid实现此目的。
data <- read.table(text="
group1 group2 rate
A D 0.01
A D 0.001
A D 0.0001
B D 0.01
B D 0.001
B D 0.0001
D A 0.01
D A 0.001
D A 0.0001
D B 0.01
D B 0.001
D B 0.0001",
header=TRUE)
g1 <- levels(data$group1)
g2 <- levels(data$group2)
r <- levels(factor(data$rate))
var1 <- var2 <- var3 <- factor(seq(0,1,0.25))
dataout <- expand.grid(g1,g2,r,var1,var2,var3)
colnames(dataout) <- c("group1", "group2", "rate","var1","var2","var3")
View(dataout)
如果您只是在寻找group1,group2和rate已有的特定组合,则可以创建一个新列以指示这些唯一组合,然后运行expand.grid
data <- read.table(text="
group1 group2 rate
A D 0.01
A D 0.001
A D 0.0001
B D 0.01
B D 0.001
B D 0.0001
D A 0.01
D A 0.001
D A 0.0001
D B 0.01
D B 0.001
D B 0.0001",
header=TRUE)
dataext <- data[rep(seq_len(nrow(data)), 125), ]
data$key <- seq(1:length(data$group1))
dataout2 <- expand.grid(data$key,var1,var2,var3)
colnames(dataout2) <- c("key","var1","var2","var3")
datafin <- cbind(dataext,dataout2[2:4])
View(datafin)
答案 1 :(得分:0)
因此,我忘记了有一个用于检查列组合的expand.grid
选项。这就是我想要的数据框的方式。
a <- list (var1 = (seq(0,1, 0.25)), var2 = (seq(0,1, 0.25)), var3 = (seq(0,1, 0.25)) )
c<- expand.grid(a)
expv<- c[rep(seq_len(nrow(c)), 12), ]
dataext$var1 <- expv$var1
dataext$var2 <- expv$var2
dataext$var3 <- expv$var3
我手动检查了结果数据框,但我也尝试绘制它。
datamelt <- melt(dataext, id.vars = c ("group1", "group2", "rate"), value.name= "val", variable.name ="varsname" )
ggplot(datamelt, aes(x=as.factor(rate), y=val, color=varsname)) + geom_point(position=position_jitterdodge()) + facet_grid(group1~group2)
我认为它有效。 :)