我想对带有权重的非二进制变量做一些基本的汇总统计。我有一个收入数据,在我按人口统计群体使用groupby()
之后,我想做describe()
之类的事情,但有权重。
在Using describe() with weighted data和pandas: groupby and variable weights中,OP提出了非常相似的问题,但答案不够充分。在我的情况下,我想要百分位数分布,包括中位数,因此将感兴趣的变量乘以赢得的权重。
鉴于有多少数据分析是通过权重进行的,我发现很难相信没有简单的方法来处理权重并且想在这里试试我的运气!