stata multiple imputation impute chained

时间:2017-03-02 16:16:49

标签: imputation

我一直在尝试用大数据集(600k行)上的stata进行多次插补,但是我得到了一些我无法解释的错误。 也尝试了不同的方法,但我总是有一些问题..希望你能帮助我,我有点新的多重插补。 抱歉德国变量,但我想你不会有很大的问题。

set more off
set level 99
mi set mlong
mi misstable patterns leistungsfähig  sa_n Bewilligungsdiagnosegruppen1 Berufstellung Arbeitsunf Erwerbst Rehadauer1 sb_n Berufsgrkl famstand1 Rehaart ORT bb_n, frequency


mi register imputed leistungsfähig  sa_n Bewilligungsdiagnosegruppen1 Berufstellung Arbeitsunf Erwerbst Rehadauer1 sb_n Berufsgrkl famstand1 Rehaart ORT bb_n

mi impute chained (logit, augment) leistungsfähig (regress, bootstrap) Rehadauer1(ologit) sb_n bb_n (mlogit, augment) sa_n Bewilligungsdiagnosegruppen1  Berufstellung Arbeitsunf Erwerbst Berufsgrkl famstand1 Rehaart ORT= sexn Alter_n AmR AHB, add(5) dots savetrace(trace1,replace)

错误:

  1. 输入m = 1到m = 5 matsize太小 您试图创建一个包含太多行或列的矩阵,或者尝试使用太多变量来填充模型。你需要增加matsize;它目前是400.使用set matsize; 见帮助matsize。
  2. 增加了垫子尺寸(450和更高),仍然是相同的错误

    1. 如果您正在使用因子变量并且包含具有大量缺失单元格的交互,则可以增加matsize或设置emptycells drop以减少所需的矩阵大小;请参阅帮助设置emptycells。
    2. 使用 set emptycells drop ,仍然是同样的错误

      1. 如果您使用因子变量,您可能会意外地将连续变量视为分类变量,从而产生大量类别。使用c。操作员对这些变量。 在leistungsfähigRehadauer1sb_n bb_n sa_n的插补过程中发生错误 Bewilligungsdiagnosegruppen1 Berufstellung Arbeitsunf Erwerbst Berufsgrkl famstand1 Rehaart ORT on m = 1
      2. 问题是,只有 Rehadauer1 不是分类变量..所以我必须写 c.Rehadauer1 ,或者它是什么意思?

        mi和ice的另一种方法():

        mi register imputed leistungsfähig  sa_n Bewilligungsdiagnosegruppen1 Berufstellung Arbeitsunf Erwerbst Rehadauer1 sb_n Berufsgrkl famstand1 Rehaart ORT bb_n    
        mi export ice, clear    
        ice leistungsfähig m.sa_n m.Bewilligungsdiagnosegruppen1 m.Berufstellung m.Arbeitsunf m.Erwerbst i.sexn o.sb_n o.Berufsgrkl m.famstand1 m.Rehaart i.AHB m.ORT o.bb_n Alter_n  Rehadauer1 AmR, m(5) cmd(AmR Rehadauer1 Alter_n: regress) nopp  saving(icedata, replace)
        

        这里的问题是,如果在没有nopp的情况下使用它将始终抛出错误“检测到完美预测”。

0 个答案:

没有答案