我从biomart下载了人类基因组的外显子坐标(hg38)和ensembl版本87。我提取了以下信息。
Chromosome/scaffold name Exon ID Exon Chr Start (bp) Exon Chr End (bp) Strand
对于相同的染色体名称和外显子起点和终点坐标,有多个外显子ID。我无法理解为什么?
例如,在染色体5正链(+)上,在基因组坐标(起始位置141505393和停止位置141505481)处,有超过1个外显子ID(ENSE00003461101和ENSE00003463136以及ENSE00003473630和ENSE3474096以及ENSE00003484284)。
换句话说,所有这些不同的外显子ID都是完全相同的外显子,在相同的染色体和同一条链上具有相同的起始和终止坐标。
怎么可能?我错过了什么吗?