应用错误收集

如何在R中的“ ivprobit”包中使用“ ivprobit”功能？

时间：2019-02-21 12:01:10

标签： r syntax regression logistic-regression

我试图理解R中“ ivprobit”软件包中“ ivprobit”功能的语法。该指令说：

 Usage
 ivprobit(formula, data)

 Arguments
    formula y~x|y1|x2 whre y is the dichotomous l.h.s.,x is the r.h.s.    
            exogenous variables,y1 is the r.h.s. endogenous variables and 
            x2 is the complete set of instruments
    data    the dataframe

然后显示相应的示例：

 data(eco)

 pro<-ivprobit(d2~ltass+roe+div|eqrat+bonus|ltass+roe+div+gap+cfa,eco)

 summary(pro)

如果我符合说明的要求，

 y= d2 = dichotomous l.h.s.
 x= ltass+roe+div = the r.h.s. exogenous variables
 y1= eqrat+bonus = the r.h.s. endogenous variables
 x2= tass+roe+div+gap+cfa = the complete set of instruments

我不明白x和x2之间的区别。另外，如果x2是完整的工具集，为什么它还不包含内生变量y1？相反，它还包括“ gap”和“ cfa”变量，它们甚至都没有在x（外生变量）或y中显示。

如果说，我选择的工具变量确实是“ eqrat”和“ bonus”，那么我如何构造才能知道x（外生变量）和x2（整套工具）之间的区别？

1 个答案:

答案 0 :(得分：4)

请注意，在这里我们讨论的是sintax，而不是模型的“优点”，对于这种问题，您应该参考https://stats.stackexchange.com/。

我们以下面的公式为例：。

正如正确指出的那样，在等式中不是真的，只是一个例子。

这里：

是因变量；
是“有问题”的内生变量（一个或多个）；
是不是“有问题”的外生变量（一个或多个）；
是“帮助”内生变量的工具（一个或多个）；

为什么内源性有问题？因为它们与错误相关，所以这会导致经典OLS估计出现问题。

是工具，因为它们具有一些基本的特性（更多here）：

独立于误差项；
在保持不变的情况下，不会影响；
与相关。

在拟议的sintax中，我们有：

x，外生的，对应于（没有问题）；
y1，内生的，对应于（有问题）；
x2，整套工具，对应于。

在您引用的示例中，x2与x共享一些公用变量，x2是一组外生变量（没有问题），另外还有两个工具。

该模型使用3个外生变量作为工具，加上另外两个变量。

我不明白x和x2之间的区别

x是工具，可能与一组外生变量（fem_works）重叠。

如果x2是完整的工具集，为什么它还不包含内生变量y1？

不必包括内生变量，因为这些是使用工具需要方程式照顾的变量。

一个例子：

您要构建一个模型，以预测是否有两个父母家庭中的妇女被雇用。您具有以下变量：

fem_edu，响应或因变量；
kids，外来女性的教育水平；
other_income，这对夫妇的孩子数量，外生；
male_edu，家庭收入，内生的（您知道这是先验知识）；
ivprobit，男人的文化程度，乐器（您选择此选项）。

对于mod <- ivprobit(fem_works ~ fem_edu + kids | other_income | fem_edu + kids + male_edu, data)，这将是：

other_income

fem_works对于模型是有问题的，因为您怀疑它与误差项相关（其他冲击可能会影响other_income和male_edu），因此您决定使用{{ 1}}作为工具，以“缓解”该问题。（示例取自here）