我的数据如下:
round <- c(rep("A", 3), rep("B", 3))
experiment <- rep(c("V1", "V2", "V3"), 2)
results <- rnorm(mean = 10, n = 6)
df <- data.frame(round, experiment, results)
> df
round experiment results
1 A V1 9.782025
2 A V2 8.973996
3 A V3 9.271109
4 B V1 9.374961
5 B V2 8.313307
6 B V3 10.837787
我有一个不同的数据集将与此合并,round
和experiment
的每个组合都是唯一的行值,即"A_V1"
。所以我真正想要的是一个变量name
,它将两列连接在一起。然而,在dplyr中这比我预期的要困难得多。我试过了:
name_mix <- paste0(df$round, "_", df$experiment)
new_df <- df %>%
mutate(name = name_mix) %>%
select(name, results)
但我得到了错误Column name must be length 1 (the group size), not 6
。我还尝试了cbind(df, name_mix)
的简单base-R方法,但收到了类似的错误,告诉我df
和name_mix
的大小不同。我做错了什么?
答案 0 :(得分:6)
您可以使用unite
tidyr
功能
require(tidyverse)
df %>%
unite(round_experiment, c("round", "experiment"))
round_experiment results
1 A_V1 8.797624
2 A_V2 9.721078
3 A_V3 10.519000
4 B_V1 9.714066
5 B_V2 9.952211
6 B_V3 9.642900
答案 1 :(得分:2)
如果您正在寻找新变量
,这应该可以解决问题library(tidyverse)
round <- c(rep("A", 3), rep("B", 3))
experiment <- rep(c("V1", "V2", "V3"), 2)
results <- rnorm(mean = 10, n = 6)
df <- data.frame(round, experiment, results)
df
df <- df %>% mutate(
name = paste(round, experiment, sep = "_")
)
答案 2 :(得分:1)
另一种解决方案可能是在stringi包中使用stri_join函数。
library(stringi)
df$new = stri_join(df$round,df$experiment,sep="_")
答案 3 :(得分:0)
您也可以尝试以下方法:
library(tidyr)
library(dplyr)
df = df %>%
unite(combined, round, experiment, sep = "_", remove = FALSE)
输出将是:
combined round experiment results
A_V1 A V1 10.152329
A_V2 A V2 10.863128
A_V3 A V3 10.975773
B_V1 B V1 9.964696
B_V2 B V2 9.876675
B_V3 B V3 9.252936
这将保留您的原始列。