我有一个微阵列数据表达文件,其中包含排名最高的基因(带有探针ID)。我想将它们与Gene Annotation文件中的探针ID相匹配。现在问题是,Gene Annotation文件包含相同的探针ID但是以大写字母表示200738_S_AT。在数据表达式文件中,它看起来像:200738_s_at。我试过这个功能 -
grep(dat_expr_probe_IDS, Gene_annot$probeIDs, ignore.case=TRUE,value=TRUE)
但它只返回一个带有此警告的探测ID -
argument 'pattern' has length > 1 and only the first element will be used
如何增加图案长度以匹配它们?
数据表达式文件如下所示 -
probe IDS
1 202958_at
2 203050_x_at
3 217980_s_at
4 225265_at
...
基因注释文件示例在这里 -
probe IDS
1 202968_AT
2 203050_X_AT
3 217981_S_AT
4 225265_AT
...
提前致谢!