根据单独的索引

时间:2018-05-12 15:22:12

标签: r matrix indexing bioinformatics

我目前正在处理一个如下所示的矩阵:

gene ID    untreated_1 merb_2h_1 merb_4h_1 merb_8h_1
1            2.961344  2.656308  3.322758  3.201053
100          3.998061  3.860054  3.934714  3.069164
1000         8.987753  9.125033  9.220713  9.141715
10000        8.165543  7.973907  7.472961  7.361228
10001       4.8865396  4.641879  4.523251  3.411761
100033431   0.5847026  1.347103  1.203390  1.550687

我想在hgnc命名法下更改基因ID列的等效名称,我已在下面的基因注释表中列出:

       gene ensembl_gene_id hgnc_symbol
1         1 ENSG00000121410 A1BG
2        10 ENSG00000156006 NAT2 
3       100 ENSG00000196839 ADA  
4      1000 ENSG00000170558 CDH2 
5     10000 ENSG00000117020 AKT3
6 100008586 ENSG00000224659 GAGE12J 
7 100009676 ENSG00000256628 ZBTB11-AS1 

请注意,只有注释表的某些基因存在于我正在使用的矩阵中。我的问题是如何从我正在使用的矩阵重命名基因ID列,通过我在单独的基因注释列表上的hgnc命名法。我正在使用一个非常大的矩阵,所以我想我需要一些并行任务。

1 个答案:

答案 0 :(得分:0)

df1$geneID <- df2$hgnc_symbol[match(df1$geneID,df2$gene)]