循环输出保存因子变量的级别

时间:2017-03-30 14:41:13

标签: loops bigdata stata stata-macros

我正在使用大型数据集(1800万次观察)。

我需要一个连续变量X,我需要通过一个约6k级别的因子变量进行分析。我想帮助创建一个循环函数,对于每个级别的因子变量,将给出X的平均值和标准差,保存平均值和标准差,然后进入下一个级别因素和重复。

我认为循环会解决这个问题,因为我需要重复这个过程约6,000个因子级别。我特别想知道如何告诉Stata一旦完成前一个进入下一个因素级别,并保存平均值&标准偏差,不会覆盖先前因子水平的这些统计数据。

理想情况下,我能够将因子的每个级别的输出保存到Excel工作表,每行代表一个因子级别,三列:A将是因素级别,B将是平均值,C将是标准偏差。

1 个答案:

答案 0 :(得分:1)

不需要循环;只需使用Stata的set seed 123 clear set obs 100000 gen x = runiform() gen a = runiformint(1,60) collapse (mean) m=x (sd) sd=x, by(a) 命令:

  labelFormatter: function () {
      return '<div class="legend-label-md row" style=" border-bottom:1px solid black; margin-bottom: 5px"><span class="col-md-10">' + this.name +
             '</span><span class="col-md-2" >' + this.value +
              '%</span></div> ';
       }