在熊猫数据框中添加代表各组中位数的列

时间:2018-11-27 23:51:09

标签: python pandas

我有一个熊猫数据框het,其布局如下:

SampleID   expr  Gene        Period  Consequence            isPTV
HSB430    -1.23  ENSG000098  4       upstream_gene_variant  0
HSB321    -0.02  ENSG000098  5       stop_gained            1
HSB296     3.12  ENSG000027  4       upstream_gene_variant  0
HSB201     1.22  ENSG000027  4       intron_variant         0
HSB220     0.13  ENSG000013  6       intron_variant         0

我正在尝试对其进行组织,以使我按Gene分组,然后获得该expr的所有SampleIDs的中位数Gene。我试图通过以下方法做到这一点:

het_grouped= het.groupby(['Gene'])['expr'].median().reset_index()

我遇到的问题是:

1)它摆脱了我的其他专栏(它只在Geneexpr栏中出现)。

2)中值替换了原始的expr值。我希望将Median放在单独的栏中。

我尝试通过执行以下操作来解决2),但结果Median列显示为空白:

het["Median"]= het.groupby(['Gene'])['expr'].median()

这是我的预期输出

SampleID   expr  Gene        Period  Consequence           isPTV  Median
HSB430    -1.23  ENSG000098  4       upstream_gene_variant  0    -0.625 
HSB321    -0.02  ENSG000098  5       stop_gained            1    -0.625
HSB296     3.12  ENSG000027  4       upstream_gene_variant  0     2.17
HSB201     1.22  ENSG000027  4       intron_variant         0     2.17
HSB220     0.13  ENSG000013  6       intron_variant         0     0.13

0 个答案:

没有答案