生成数据帧的组合,而没有数据帧内的列组合(在R中)

时间:2018-10-31 21:26:39

标签: r performance combinations

我正在扩展数据帧之间的所有行组合,但没有扩展数据帧中的列之间。这是我目前如何实现此示例的示例enter code here

df_1 <- data.frame(letters = letters[1:2], 
                   LETTERS = LETTERS[1:2],
                   greek = c("alpha", "beta"),
                   GREEK = c("ALPHA", "BETA"),
                   stringsAsFactors = F)
df_2 <- data.frame(numbers = c("one", "two"),
                   nums = 1:2,
                   imaginary = paste0(1:2, "i"),
                   stringsAsFactors = F)

result <- expand.grid(letters = df_1$letters, numbers = df_2$numbers,
                      stringsAsFactors = F)

for(n in 1:nrow(df_1)){
  matching_rows <- df_1[n,"letters"]==result$letters
  for(column in colnames(df_1)[-1]){
    result[matching_rows, column] <- df_1[n,column]
  }
}

for(n in 1:nrow(df_2)){
  matching_rows <- df_2[n,"numbers"]==result$numbers
  for(column in colnames(df_2)[-1]){
    result[matching_rows, column] <- df_2[n,column]
  }
}
> result
  letters numbers LETTERS greek GREEK nums imaginary
1       a     one       A alpha ALPHA    1        1i
2       b     one       B  beta  BETA    1        1i
3       a     two       A alpha ALPHA    2        2i
4       b     two       B  beta  BETA    2        2i

这个结果是正确的,但是for循环正在以我的表现为食,而且看起来简直荒谬。

我的理想结果看起来更像expand.grid(df_1, df_2),但该函数不将数据帧作为输入。

什么是实现此结果的更高性能(最好是更优雅)的方法?

2 个答案:

答案 0 :(得分:1)

尝试一下

> merge(df_1, df_2)
  letters LETTERS greek GREEK numbers nums imaginary
1       a       A alpha ALPHA     one    1        1i
2       b       B  beta  BETA     one    1        1i
3       a       A alpha ALPHA     two    2        2i
4       b       B  beta  BETA     two    2        2i

答案 1 :(得分:0)

您可以将expand.grid()用于行索引:

ind <- expand.grid(seq_len(nrow(df_1)), seq_len(nrow(df_2)))
cbind(df_1[ind$Var1, ], df_2[ind$Var2, ])