为什么当我运行强大的标准错误时,我得到了t值,标准误差等的NA值

时间:2017-11-25 17:37:47

标签: r regression

我在Rstudio中使用以下data。 我运行回归minreg <- lm(lwage76~ed76 + exp76 + exp762, data = nlsdata),然后查看系数coeftest(minreg, vcovHC)。到目前为止,每件事都很好。然后我运行相同的回归,但包含一个额外的变量:minreg_a <- lm(lwage76~ed76 + exp76 + exp762 + kww, data = nlsdata)然后查看系数coeftest(minreg_a, vcovHC)

t test of coefficients:

              Estimate Std. Error t value Pr(>|t|)
(Intercept)  4.6051063         NA      NA       NA
ed76         0.0596900         NA      NA       NA
exp76        0.0699201         NA      NA       NA
exp762      -0.0021611         NA      NA       NA
kww11        0.3504745         NA      NA       NA
kww12        0.0468874         NA      NA       NA
kww13        0.2146929         NA      NA       NA
kww14        0.0623738         NA      NA       NA
kww15        0.0298164         NA      NA       NA
kww16        0.2308240         NA      NA       NA
kww17        0.1766641         NA      NA       NA
kww18        0.2579742         NA      NA       NA
kww19        0.2125317         NA      NA       NA
kww20        0.2498308         NA      NA       NA
kww21        0.2670052         NA      NA       NA
kww22        0.3581900         NA      NA       NA
kww23        0.5047055         NA      NA       NA
kww24        0.2953582         NA      NA       NA
kww25        0.3738028         NA      NA       NA
kww26        0.3819417         NA      NA       NA
kww27        0.3533177         NA      NA       NA
kww28        0.4772736         NA      NA       NA
kww29        0.4024529         NA      NA       NA
kww30        0.3988244         NA      NA       NA
kww31        0.4426652         NA      NA       NA
kww32        0.4117452         NA      NA       NA
kww33        0.4294092         NA      NA       NA
kww34        0.4356410         NA      NA       NA
kww35        0.4399743         NA      NA       NA
kww36        0.4630381         NA      NA       NA
kww37        0.4779400         NA      NA       NA
kww38        0.4867528         NA      NA       NA
kww39        0.5439840         NA      NA       NA
kww4         0.1968018         NA      NA       NA
kww40        0.5427968         NA      NA       NA
kww41        0.5436628         NA      NA       NA
kww42        0.6319893         NA      NA       NA
kww43        0.5522148         NA      NA       NA
kww44        0.5540705         NA      NA       NA
kww45        0.5897991         NA      NA       NA
kww46        0.5372961         NA      NA       NA
kww47        0.7583224         NA      NA       NA
kww48        0.8191181         NA      NA       NA
kww49        0.5448992         NA      NA       NA
kww50        0.7070670         NA      NA       NA
kww51        0.6892674         NA      NA       NA
kww52        0.6381098         NA      NA       NA
kww53        0.5876115         NA      NA       NA
kww54        0.7680939         NA      NA       NA
kww55        1.1111694         NA      NA       NA
kww56        0.5049158         NA      NA       NA
kww6         0.0831418         NA      NA       NA
kww8         0.3058253         NA      NA       NA
kwwNA        0.3973854         NA      NA       NA

我在这里有一个问题:为什么NA​​输出;这些只在我尝试运行强大的标准错误时才会出现?

这让我感到困惑

1 个答案:

答案 0 :(得分:0)

对不起,您现在可能已经找到答案了,但是我只是通过执行分层分析而遇到了相同的问题。在整个数据集上,我可以计算出从HC0到HC5的鲁棒标准误差,但是当按相对较小的子集进行分层(约占样本的10%,n〜2300)时,我只能计算出具有HC0和HC1的鲁棒标准误差(即,我得到了HC2及更高版本的NA,就像您所做的一样。这个问题(我假设)与模型中两个变量(种族和收入)(两个因素)之间的协方差有关。在此子集中,少数族裔中的许多人仅属于收入变量的几个级别,反之亦然。当我删除收入或种族,或调整分层以使该子集的大小达到两倍时,一切正常(即没有资产净值)。

我意识到这是一个非常有趣的答案,但我希望它会有所帮助。如果这对更好地了解这些程序的人有意义,那么也许他们可以提供更全面的答复。