在R中复制和更改数据帧

时间:2012-09-11 02:23:38

标签: r

您好我正在尝试复制一个数据框,然后更改一个名为" i"的列。用于基于复制数的迭代。

E.g。我的起始数据框是:

dataframex <- data.frame(i = c(1, 1, 1),
                         x = c(1, 3, 5),
                         y = c(2, 4, 6))
dataframex 
#   i x y
# 1 1 1 2
# 2 1 3 4
# 3 1 5 6

我使用了命令代码

dataframex[rep(1:nrow(dataframex), times=3), ]
#     i x y
# 1   1 1 2
# 2   1 3 4
# 3   1 5 6
# 1.1 1 1 2
# 2.1 1 3 4
# 3.1 1 5 6
# 1.2 1 1 2
# 2.2 1 3 4
# 3.2 1 5 6

但我真正想要的是:

#     i x y
# 1   1 1 2
# 2   1 3 4
# 3   1 5 6
# 1.1 2 1 2
# 2.1 2 3 4
# 3.1 2 5 6
# 1.2 3 1 2
# 2.2 3 3 4
# 3.2 3 5 6

即。迭代列表示我拥有的复制数据集的数量。我想然后使用迭代列将此数据框与另一个合并。

P.S。对不起,这是我第一次使用stackoverflow而且我无法弄清楚如何制作表格,所以我希望你能理解我的临时列分隔符。

2 个答案:

答案 0 :(得分:1)

设置数据:

test <- read.table(textConnection("i x y
1 1 2
1 3 4
1 5 6"),header=TRUE)

> test
  i x y
1 1 1 2
2 1 3 4
3 1 5 6
来自lapply

1:number_of_repeats_wanted以获得结果:

result <- do.call(rbind,lapply(1:3,function(i) data.frame(i,test[-1])))

> result
  i x y
1 1 1 2
2 1 3 4
3 1 5 6
4 2 1 2
5 2 3 4
6 2 5 6
7 3 1 2
8 3 3 4
9 3 5 6

答案 1 :(得分:1)

三种可能的方法:

您的数据

DF <- data.frame(i=1,x=1:3,y=4:6)
# create a list with your data replicated three times
df_list <- replicate(n = 3, DF, simplify = F)
# go along this list and add a replicate column as `i`
df_list <- mapply(function(x,value,i) {x[,i] <- value;x}, value = seq_along(df_list), x = df_list, MoreArgs = list(i='i'), SIMPLIFY = F)
# combine into a data.frame
do.call(rbind,df_list)

甚至更简单

# don't have `i` defined yet
DF <- data.frame(x=1:3,y=1:4)
# add and combine into a data.frame
do.call(rbind,lapply(1:3, function(i,data) {data$i <- i;data}, data = DF))

两者都会导致

##  i x y
## 1 1 1 4
## 2 1 2 5
## 3 1 3 6
## 4 2 1 4
## 5 2 2 5
## 6 2 3 6
## 7 3 1 4
## 8 3 2 5
## 9 3 3 6

使用您的初始方法

new_DF <- DF[rep(1:nrow(DF), times=3), ]
new_DF$i <- rep(1:nrow(DF), times = 3)
new_DF
##     i x y
## 1   1 1 4
## 2   2 2 5
## 3   3 3 6
## 1.1 1 1 4
## 2.1 2 2 5
## 3.1 3 3 6
## 1.2 1 1 4
## 2.2 2 2 5
## 3.2 3 3 6