Question

我目前正在处理一个如下所示的矩阵：

gene ID    untreated_1 merb_2h_1 merb_4h_1 merb_8h_1
1            2.961344  2.656308  3.322758  3.201053
100          3.998061  3.860054  3.934714  3.069164
1000         8.987753  9.125033  9.220713  9.141715
10000        8.165543  7.973907  7.472961  7.361228
10001       4.8865396  4.641879  4.523251  3.411761
100033431   0.5847026  1.347103  1.203390  1.550687

我想在hgnc命名法下更改基因ID列的等效名称，我已在下面的基因注释表中列出：

       gene ensembl_gene_id hgnc_symbol
1         1 ENSG00000121410 A1BG
2        10 ENSG00000156006 NAT2 
3       100 ENSG00000196839 ADA  
4      1000 ENSG00000170558 CDH2 
5     10000 ENSG00000117020 AKT3
6 100008586 ENSG00000224659 GAGE12J 
7 100009676 ENSG00000256628 ZBTB11-AS1

请注意，只有注释表的某些基因存在于我正在使用的矩阵中。我的问题是如何从我正在使用的矩阵重命名基因ID列，通过我在单独的基因注释列表上的hgnc命名法。我正在使用一个非常大的矩阵，所以我想我需要一些并行任务。

Answer 1

df1$geneID <- df2$hgnc_symbol[match(df1$geneID,df2$gene)]

根据单独的索引

1 个答案: