我在以下问题上找不到Stata命令,所以我手动解决了它:
根据官方手册,Stata不会对崩溃命令中的平均值进行加权(Collapse章节的第6页):
这意味着我无法在一周/产品级别获得我的销售数据集中支付的加权平均价格,其中权重是销售的单位。该数据集是单个交易的集合,其中包含购买数量和按周/商店/产品级别支付的每单位价格:
clear
set more off
week,store,product,price,units
1,1,cheer,1,10
1,1,tide,2,6
1,2,cheer,2,7
1,2,tide,3,5
2,1,cheer,1,15
2,1,tide,1,20
2,1,mrclean,2,8
2,2,cheer,2,8
2,2,tide,4,5
2,2,mrclean,3,4
显然,在折叠时采用简单平均值会忽略购买的单位数量,从而导致错误的平均价格估算值。
所以我做的是手动计算原始数据集中的新变量price x units
。然后,我通过总结price x units
和units
变量来折叠数据集:
collapse (sum) pricexunits units, by(week product)
最后,我创建了一个新变量,我将pricexunits
除以units
。你认为我可以采取不同的做法吗?
答案 0 :(得分:2)
你误读了那些文档。
重点是规范化是否会对不同类型的权重的结果产生影响,而不是是否允许权重。实际上,通常允许权重,如帮助和手动输入所解释的那样。
因此,频率加权和或计数与分析加权和或计数不同,等等。
collapse (mean)
允许权重。尝试一下,例如
collapse (mean) price [w=units] , by(week product)