我有两个数据帧
第一个(A):
第一个col是“行名”
GTEX-11DXY-0426-SM-5H12R GTEX-11EQ8-0826-SM-5N9FG [...30]
ENSG00000223972.4 0 1
ENSG00000227232.4 663 802
ENSG00000243485.2 0 1
ENSG00000237613.2 0 0
ENSG00000268020.2 0 1
ENSG00000240361.1 3 0
它将继续以相同的格式显示30列
我想根据另一个数据框列的顺序对其进行排序,如下所示:
> head(targets10)
# A tibble: 6 x 7
# Groups: Group [1]
Sample_Name Grupo_analisis body_site molecular_data_~ sex Group
1 GTEX-11XUK~ 3 Thyroid RNA Seq (NGS) fema~ ELI
2 GTEX-R55G-~ 3 Thyroid RNA Seq (NGS) fema~ ELI
3 GTEX-PLZ4-~ 3 Thyroid RNA Seq (NGS) fema~ ELI
4 GTEX-14AS3~ 3 Thyroid RNA Seq (NGS) fema~ ELI
5 GTEX-14BMU~ 3 Thyroid Allele-Specific~ fema~ ELI
6 GTEX-13QJC~ 3 Thyroid Allele-Specific~ fema~ ELI
# ... with 1 more variable: ShortName <fct>
Sample_Name列的名称与数据框A中各列的标题相同。
我希望它们具有相同的顺序,因此数据帧A中的第一列是target10 $ Sample_Name中的第一行
我尝试了以下操作:
library(data.table)
setDT(countdata)
setcolorder(countdata, as.character(coldata$Sample_Name))
它可以正常工作,但是从数据框中删除了我的rownames
,我需要他们留下来!!
请帮助我
非常感谢
答案 0 :(得分:1)
无需考虑您的数据是否被打乱并计划成为data.tables,这适用于普通data.frames:
A <- data.frame(id = LETTERS, c = rnorm(26), d=rnorm(26), a = 1:26, b = 26:1)
B <- data.frame(sample = c("a", "b", "c", "d"), ignore =rnorm(4))
new.A <- cbind(A$id, A[,B$sample])
head(new.A)
修改
仅实现的id不在列中,而在行名中。使此方法更加容易:
A <- data.frame(c = rnorm(26), d=rnorm(26), a = 1:26, b = 26:1)
rownames(A) <- LETTERS
B <- data.frame(sample = c("a", "b", "c", "d"), ignore =rnorm(4))
new.A <- A[, B$sample]
head(new.A)
答案 1 :(得分:0)
您可以这样做:
dput(dfB$Sample_Name)
,它将Sample_Name
列的值打印到您的控制台。然后,您可以复制输出,然后执行:
library(dplyr)
dfA <- dfA %>%
select("GTEX-11XUK", "GTEX-R55G", etc...)
或者像Gregor所说的那样不那么笨拙:
dfA <- dfA %>%
select(all_of(dfB$Sample_Name))