我目前正在处理一个如下所示的矩阵:
gene ID untreated_1 merb_2h_1 merb_4h_1 merb_8h_1
1 2.961344 2.656308 3.322758 3.201053
100 3.998061 3.860054 3.934714 3.069164
1000 8.987753 9.125033 9.220713 9.141715
10000 8.165543 7.973907 7.472961 7.361228
10001 4.8865396 4.641879 4.523251 3.411761
100033431 0.5847026 1.347103 1.203390 1.550687
我想在hgnc命名法下更改基因ID列的等效名称,我已在下面的基因注释表中列出:
gene ensembl_gene_id hgnc_symbol
1 1 ENSG00000121410 A1BG
2 10 ENSG00000156006 NAT2
3 100 ENSG00000196839 ADA
4 1000 ENSG00000170558 CDH2
5 10000 ENSG00000117020 AKT3
6 100008586 ENSG00000224659 GAGE12J
7 100009676 ENSG00000256628 ZBTB11-AS1
请注意,只有注释表的某些基因存在于我正在使用的矩阵中。我的问题是如何从我正在使用的矩阵重命名基因ID列,通过我在单独的基因注释列表上的hgnc命名法。我正在使用一个非常大的矩阵,所以我想我需要一些并行任务。
答案 0 :(得分:0)
df1$geneID <- df2$hgnc_symbol[match(df1$geneID,df2$gene)]