我是大熊猫的新手,并坚持根据人口统计目标计算权重。
以下是我的数据集中的计数:
group = df.groupby('GENDR')['Age_cat'].value_counts(sort=False)
GENDR Age_cat
1 18 to 24 19
25 to 34 24
35 to 44 25
45 to 54 23
55 to 64 16
65+ 64
2 18 to 24 14
25 to 34 19
35 to 44 24
45 to 54 25
55 to 64 17
65+ 51
Name: Age_cat, dtype: int64
这是我的加权目标,我将其加载到一个单独的数据框中。
wt = wt.unstack()
wt
Male0 0.058783
1 0.080367
2 0.082995
3 0.098865
4 0.080890
5 0.082726
Fema0 0.056920
1 0.082637
2 0.086267
3 0.101823
4 0.084402
5 0.103325
dtype: float64
那我怎么把这些放在一起呢?我想为每个案例创建一个权重值,以达到所需的比例。