我有一个熊猫数据框het
,其布局如下:
SampleID expr Gene Period Consequence isPTV
HSB430 -1.23 ENSG000098 4 upstream_gene_variant 0
HSB321 -0.02 ENSG000098 5 stop_gained 1
HSB296 3.12 ENSG000027 4 upstream_gene_variant 0
HSB201 1.22 ENSG000027 4 intron_variant 0
HSB220 0.13 ENSG000013 6 intron_variant 0
我正在尝试对其进行组织,以使我按Gene
分组,然后获得该expr
的所有SampleIDs
的中位数Gene
。我试图通过以下方法做到这一点:
het_grouped= het.groupby(['Gene'])['expr'].median().reset_index()
我遇到的问题是:
1)它摆脱了我的其他专栏(它只在Gene
和expr
栏中出现)。
2)中值替换了原始的expr
值。我希望将Median
放在单独的栏中。
我尝试通过执行以下操作来解决2),但结果Median
列显示为空白:
het["Median"]= het.groupby(['Gene'])['expr'].median()
这是我的预期输出:
SampleID expr Gene Period Consequence isPTV Median
HSB430 -1.23 ENSG000098 4 upstream_gene_variant 0 -0.625
HSB321 -0.02 ENSG000098 5 stop_gained 1 -0.625
HSB296 3.12 ENSG000027 4 upstream_gene_variant 0 2.17
HSB201 1.22 ENSG000027 4 intron_variant 0 2.17
HSB220 0.13 ENSG000013 6 intron_variant 0 0.13