给出这样的数据框:
Group Feature
A 0.1
B 0.8
A 0.2
A 0.2
B 0.3
...
我想分析每个组的每个功能分布,并将它们相互关联。目标是获得各个分布的均值,中位数,偏度和分位数的随机变量均值,中位数,偏度和分位数的分布。
此外,我想绘制分布图,同时突出显示平均值,例如0.25和0.75百分位数的分布。
示例图:
我的第一个想法是计算一个新的数据框,如:
Group Mean Median Skewness 0.1Percentile 0.2Percentile .....
A 0.2 0.2 0.3 0.01 0.02
C 0.3 0.2 1.2 0.05 0.06
...
可以绘制每一行,并打印列的分布统计信息。
但这对我来说似乎很笨拙。如何才能更聪明地执行?这可以执行类似于自举/重采样的方法吗?