我试图找到具有基因名和染色体位置的gene_info文件。但是,我似乎无法在NCBI FTP站点上找到它。谁能给我一个指针?
答案 0 :(得分:5)
请参阅:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/README,了解NCBI ftp网站上的文件内容。
如果你想从NCBI本身获取数据,你需要组合多个文件,可能是gene2accession(也包括位置信息)和gene_info文件,它将id映射到符号和名称等。
访问UCSC网站获取此信息可能更方便,如果您想探索可用内容,它们还提供公共mysql数据库: http://workshops.arl.arizona.edu/sql1/sql_workshop/mysql/mysqlclient.html
如果您只想要人类,鼠标或大鼠数据,那么Rat Genome Database已经编译了您想要的数据(来自NCBI和Ensembl来源): ftp://rgd.mcw.edu/pub/data_release
e.g。对于人类数据,请查看:ftp://rgd.mcw.edu/pub/data_release/GENES_HUMAN.txt