我正在使用大型数据集(1800万次观察)。
我需要一个连续变量X
,我需要通过一个约6k级别的因子变量进行分析。我想帮助创建一个循环函数,对于每个级别的因子变量,将给出X
的平均值和标准差,保存平均值和标准差,然后进入下一个级别因素和重复。
我认为循环会解决这个问题,因为我需要重复这个过程约6,000个因子级别。我特别想知道如何告诉Stata一旦完成前一个进入下一个因素级别,并保存平均值&标准偏差,不会覆盖先前因子水平的这些统计数据。
理想情况下,我能够将因子的每个级别的输出保存到Excel工作表,每行代表一个因子级别,三列:A
将是因素级别,B
将是平均值,C
将是标准偏差。
答案 0 :(得分:1)
不需要循环;只需使用Stata的set seed 123
clear
set obs 100000
gen x = runiform()
gen a = runiformint(1,60)
collapse (mean) m=x (sd) sd=x, by(a)
命令:
labelFormatter: function () {
return '<div class="legend-label-md row" style=" border-bottom:1px solid black; margin-bottom: 5px"><span class="col-md-10">' + this.name +
'</span><span class="col-md-2" >' + this.value +
'%</span></div> ';
}