如何在R中的“ ivprobit”包中使用“ ivprobit”功能?

时间:2019-02-21 12:01:10

标签: r syntax regression logistic-regression

我试图理解R中“ ivprobit”软件包中“ ivprobit”功能的语法。该指令说:

 Usage
 ivprobit(formula, data)

 Arguments
    formula y~x|y1|x2 whre y is the dichotomous l.h.s.,x is the r.h.s.    
            exogenous variables,y1 is the r.h.s. endogenous variables and 
            x2 is the complete set of instruments
    data    the dataframe

然后显示相应的示例:

 data(eco)

 pro<-ivprobit(d2~ltass+roe+div|eqrat+bonus|ltass+roe+div+gap+cfa,eco)

 summary(pro)

如果我符合说明的要求,

 y= d2 = dichotomous l.h.s.
 x= ltass+roe+div = the r.h.s. exogenous variables
 y1= eqrat+bonus = the r.h.s. endogenous variables
 x2= tass+roe+div+gap+cfa = the complete set of instruments

我不明白x和x2之间的区别。 另外,如果x2是完整的工具集,为什么它还不包含内生变量y1?相反,它还包括“ gap”和“ cfa”变量,它们甚至都没有在x(外生变量)或y中显示。

如果说,我选择的工具变量确实是“ eqrat”和“ bonus”,那么我如何构造才能知道x(外生变量)和x2(整套工具)之间的区别?

1 个答案:

答案 0 :(得分:4)

请注意,在这里我们讨论的是sintax,而不是模型的“优点”,对于这种问题,您应该参考https://stats.stackexchange.com/

我们以下面的公式为例:enter image description here

正如正确指出的那样,List item在等式中不是真的 ,只是一个例子。

这里:

  • enter image description here是因变量;

  • enter image description here是“有问题”的内生变量(一个或多个);

  • enter image description here是不是“有问题”的外生变量(一个或多个);
  • List item是“帮助”内生变量的工具(一个或多个);

为什么内源性有问题?因为它们与错误enter image description here相关,所以这会导致经典OLS估计出现问题。

enter image description here是工具,因为它们具有一些基本的特性(更多here):

  • 独立于误差项;
  • enter image description here保持不变的情况下,不会影响enter image description here
  • enter image description here相关。

在拟议的sintax中,我们有:

  • x,外生的,对应于enter image description here(没有问题);
  • y1,内生的,对应于enter image description here(有问题);
  • x2,整套工具,对应于enter image description here

在您引用的示例中,x2x共享一些公用变量,x2是一组外生变量(没有问题),另外还有两个工具。

该模型使用3个外生变量作为工具,加上另外两个变量。

  

我不明白x和x2之间的区别

x是工具,可能与一组外生变量(fem_works)重叠。

  

如果x2是完整的工具集,为什么它还不包含内生变量y1?

不必包括内生变量,因为这些是使用工具需要方程式照顾的变量。


一个例子:

您要构建一个模型,以预测是否有两个父母家庭中的妇女被雇用。您具有以下变量:

  • fem_edu,响应或因变量;
  • kids,外来女性的教育水平;
  • other_income,这对夫妇的孩子数量,外生;
  • male_edu,家庭收入,内生的(您知道这是先验知识);
  • ivprobit,男人的文化程度,乐器(您选择此选项)。

对于mod <- ivprobit(fem_works ~ fem_edu + kids | other_income | fem_edu + kids + male_edu, data) ,这将是:

other_income

fem_works对于模型是有问题的,因为您怀疑它与误差项相关(其他冲击可能会影响other_incomemale_edu),因此您决定使用{{ 1}}作为工具,以“缓解”该问题。 (示例取自here