我在使用R的体验中有一个有关如何纠正选择偏见的问题。在此体验中,我们评估了措辞中的细微调整对网络调查参与的影响。例如,如果您告诉人们大多数人都参加了,那么他们是否更愿意参与自己?这是电话调查的结尾,访调员询问被访者将来是否要参加网络调查。我们测试了几个措词,使访问者可以大声朗读给访问者。
我评估了两个因变量:第一个是该人说是或否。第二个是该人是否真正参加了调查,调查将在3或4天后进行。我最初所做的只是两个logit:我首先根据治疗方法和其他一些社会人口统计学变量(年龄,性别,收入,通常水平)评估说“是”的可能性。然后,我使用完全相同的解释变量评估接受的可能性。
但是我的论文主任告诉我(这项研究是经济学博士学位的一部分),这是错误的,因为它不能解决选择偏见。这个想法是,由于人们必须先对面试官说“是”才能参加(否则他们将不会进入邮件列表),因此第二种模式(参与)将在很大程度上受到人们说“是”的影响。 ”,而不是使他们真正参与其中的原因。
在那一点上,它与著名的赫克曼(Heckman)示例有点相似,他尝试评估决定工资的因素,但他仅拥有工作人员的数据,这些数据可能与未工作的人有很大不同。很自然,我的导演建议我研究赫克曼的两步模型。除非有两个问题,否则:第二个模型具有一个连续的因变量,而该变量是我的二元变量(它们参与或不参与),这似乎才有效。而且,也许更重要的是,我认为影响参与和说“是”的是完全相同的变量。这确实是研究假设的核心部分,我无法真正改变它。但是我已经看到,要使Heckman校正真正具有某种意义,这两种模型必须彼此不同。
最后,我真的不知道该怎么办。我对计量经济学和统计学非常不满意,在这里我感到有点不合时宜,因此,如果有人可以花时间告诉我他们对这种情况的看法,我将不胜感激。
我是否真的需要测试选择偏见,或者在我的情况下忽略它是否可以接受?如果我必须测试一个,那么鉴于我的两个模型都有一个二进制因变量并且解释变量完全相同,我可以使用哪种方法?我如何在R中做到这一点?
谢谢您的时间!