我从一些文本中提取了有关对象基因和染色体的信息,以对一些文本的数据库进行分类。
我的结果缺少一些信息;实际上,某些文本可能只包含the gene name and the location
,而我想获取omim number, the gene symbol, the gene name, and the chromosome location
这是我的结果的一部分(使用Rcode)
OMIM GENES_SYMBOL GENES CHROMOSOME
1 (NA) (arlts1) (NA) (NA)
2 (NA) (mtr) (NA) (NA)
3 (NA) (hla.g) (NA) (NA)
4 (NA) (nat2, t341c) (NA) (NA)
5 (222300) (wfs1) (NA) (X4p16)
我要摆脱不适用项:用等效的nae或代码替换每一个;例如需要arlts1
并找到指定的omm编号,基因名称和染色体位置的东西。
我进行了很多搜索,但找不到包含所有信息的详尽的数据库
我可以用biomart
来做到吗?我什至都不知道
有人可以帮助我解决我的问题吗?