如何有效地分析pandas中groupby的多个发行版

时间:2017-10-24 20:23:21

标签: python pandas matplotlib distribution pandas-groupby

给出这样的数据框:

Group Feature 
A     0.1
B     0.8
A     0.2
A     0.2
B     0.3
...

我想分析每个组的每个功能分布,并将它们相互关联。目标是获得各个分布的均值,中位数,偏度和分位数的随机变量均值,中位数,偏度和分位数的分布。

此外,我想绘制分布图,同时突出显示平均值,例如0.25和0.75百分位数的分布。

示例图:

enter image description here

我的第一个想法是计算一个新的数据框,如:

Group Mean Median Skewness 0.1Percentile 0.2Percentile .....
A     0.2  0.2    0.3      0.01          0.02
C     0.3  0.2    1.2      0.05          0.06
...

可以绘制每一行,并打印列的分布统计信息。

但这对我来说似乎很笨拙。如何才能更聪明地执行?这可以执行类似于自举/重采样的方法吗?

0 个答案:

没有答案