Question

我想通过更改第一列中的值来拆分数据帧，然后将拆分后的部分附加到新列中。下面给出一个例子。但是，我最终得到的列表无法处理到方便的数据框。

所需的输出应类似于df_goal，但其格式尚未正确。

#data

x <-c(1,2,3)
y <-c(20200101,20200101,20200101)
z <-c(4.5,5,7)
x_name <- "ID"
y_name <- "Date"
z_name <- "value"   

df <-data.frame(x,y,z)
names(df) <- c(x_name,y_name,z_name)

#processing

df$date <-format(as.Date(as.character(df$date), format="%Y%m%d"))
df01 <- split(df, f = df$ID)

#goal
a <-c(1)
b <-c(20200101)
c <-c(4.5)
d <-c(2)
e <-c(20200101)
f <-c(5)
g <-c(3)
h <-c(20200101)
i <-c(7)

df_goal <- data.frame(a,b,c,d,e,f,g,h,i)

Answer 1

您可以使用Reduce和cbind在cbind的每一行中data.frame，并保持列的类型。

Reduce(function(x,y) cbind(x, df[y,]), 2:nrow(df), df[1,])
#  ID     Date value ID     Date value ID     Date value
#1  1 20200101   4.5  2 20200101     5  3 20200101     7
#Equivalent for the sample dataset: cbind(cbind(df[1,], df[2,]), df[3,])

或do.call与split：

do.call(cbind, split(df, 1:nrow(df)))
#  1.ID   1.Date 1.value 2.ID   2.Date 2.value 3.ID   3.Date 3.value
#1    1 20200101     4.5    2 20200101       5    3 20200101       7
#Equivalent for the sample dataset: cbind(df[1,], df[2,], df[3,])

如果每个ID有几行，您可以尝试：

x <- split(df, df$ID)
y <- max(unlist(lapply(x, nrow)))
do.call(cbind, lapply(x, function(i) i[1:y,]))

Answer 2

这是您的示例的可能解决方案：

new_df = data.frame(list(df[1,],df[2,],df[3,]))

如果要在更大的data.frame上进行概括：

new_list = list()
for ( i in 1:dim(df)[1] ){
    new_list[[i]] = df[i,]
}
new_df = data.frame(new_list)

Answer 3

一个选项可能是：

setNames(Reduce(c, asplit(df, 1)), letters[1:Reduce(`*`, dim(df))])

     a          b          c          d          e          f          g          h          i 
   1.0 20200101.0        4.5        2.0 20200101.0        5.0        3.0 20200101.0        7.0

Answer 4

也许您可以尝试以下代码

df_goal <- data.frame(t(c(t(df))))

这样

> df_goal
  X1       X2  X3 X4       X5 X6 X7       X8 X9
1  1 20200101 4.5  2 20200101  5  3 20200101  7

如何拆分数据框并将拆分的部分附加到新列中？

4 个答案: