Question

问题：我想在数据框中添加三列，每一列都是一个数字序列。但是我希望每一列都与另一列有所不同。因此，这是一个示例数据框：

data <- read.table(text="
group1  group2  rate
A     D     0.01     
A     D     0.001
A     D     0.0001  
B     D     0.01    
B     D     0.001      
B     D     0.0001
D     A     0.01     
D     A     0.001
D     A     0.0001  
D     B     0.01    
D     B     0.001      
D     B     0.0001",
                   header=TRUE)

因此，首先我扩展了数据框，以容纳3列所需的数字组合。我使用125是因为每个序列有5个数字。

dataext <- data[rep(seq_len(nrow(data)), 125), ]

然后，我使用所需的数字序列创建了新列：

dataext$var1 <- rep_len (seq(0,1, 0.25), length.out=125)
dataext$var2 <- rep_len (seq(0,1, 0.25), length.out=125)
dataext$var3 <- rep_len (seq(0,1, 0.25), length.out=125)

我想要的输出示例：

group1  group2  rate    var1    var 2   var3
    A     D     0.01     0      0       0           
    A     D     0.001    0      0       0               
    A     D     0.0001   0      0       0
    A     D     0.01     0.25   0       0           
    A     D     0.001    0.25   0       0               
    A     D     0.0001   0.25   0       0
    A     D     0.01     0.25   0.25    0           
    A     D     0.001    0.25   0.25    0               
    A     D     0.0001   0.25   0.25    0
    A     D     0.01     0.25   0.25    0.25            
    A     D     0.001    0.25   0.25    0.25                
    A     D     0.0001   0.25   0.25    0.25

我希望这足够清楚。任何有关如何正确做到这一点的线索都将不胜感激。谢谢！

Answer 1

我无法发表任何评论要求澄清，但似乎您希望在group1，group2，rate，var1，var2和var3之间进行所有组合。

您可以使用expand.grid实现此目的。

data <- read.table(text="
group1  group2  rate
                   A     D     0.01     
                   A     D     0.001
                   A     D     0.0001  
                   B     D     0.01    
                   B     D     0.001      
                   B     D     0.0001
                   D     A     0.01     
                   D     A     0.001
                   D     A     0.0001  
                   D     B     0.01    
                   D     B     0.001      
                   D     B     0.0001",
                   header=TRUE)

g1 <- levels(data$group1)
g2 <- levels(data$group2)
r <- levels(factor(data$rate))
var1 <- var2 <- var3 <- factor(seq(0,1,0.25))

dataout <- expand.grid(g1,g2,r,var1,var2,var3)

colnames(dataout) <- c("group1", "group2", "rate","var1","var2","var3")

View(dataout)

如果您只是在寻找group1，group2和rate已有的特定组合，则可以创建一个新列以指示这些唯一组合，然后运行expand.grid

data <- read.table(text="
group1  group2  rate
                   A     D     0.01     
                   A     D     0.001
                   A     D     0.0001  
                   B     D     0.01    
                   B     D     0.001      
                   B     D     0.0001
                   D     A     0.01     
                   D     A     0.001
                   D     A     0.0001  
                   D     B     0.01    
                   D     B     0.001      
                   D     B     0.0001",
                   header=TRUE)
dataext <- data[rep(seq_len(nrow(data)), 125), ]

data$key <- seq(1:length(data$group1))

dataout2 <- expand.grid(data$key,var1,var2,var3)
colnames(dataout2) <- c("key","var1","var2","var3")

datafin <- cbind(dataext,dataout2[2:4])

View(datafin)

Answer 2

因此，我忘记了有一个用于检查列组合的expand.grid选项。这就是我想要的数据框的方式。

a <- list (var1 = (seq(0,1, 0.25)), var2 = (seq(0,1, 0.25)), var3 = (seq(0,1, 0.25)) )
c<- expand.grid(a)
expv<- c[rep(seq_len(nrow(c)), 12), ]

dataext$var1 <- expv$var1
dataext$var2 <- expv$var2
dataext$var3 <- expv$var3

我手动检查了结果数据框，但我也尝试绘制它。

datamelt <- melt(dataext, id.vars = c ("group1", "group2", "rate"), value.name= "val", variable.name ="varsname" )

ggplot(datamelt, aes(x=as.factor(rate), y=val, color=varsname)) + geom_point(position=position_jitterdodge()) + facet_grid(group1~group2)

我认为它有效。：）

创建多列，每列作为R中的数字序列

2 个答案: