我试图使用mlogit包估计R中的混合效果logit。如果有人能指出我的错误在哪里,我将不胜感激。
我原来的data有一个面板结构 - 每个人都可以在6种不同的场景中做出选择。每次他有4个选项(3个品牌,没有得到任何东西)。也就是说,数据集中的每个人都有24行。
我的个人特征很少。 特定于备选方案的特征也很少:一个是价格(每个方案中的每个替代方案都不同),其他特征只是替代特定的虚拟变量。这些假人表示同一产品的特定品牌。每个假人的系数根据人口统计特征而变化。
我已经阅读了Yves Croissant关于R中多项logit模型估计的pdf,并且能够使数据适应于适合于mlogit估计的格式。
data.logit = mlogit.data(data, shape = "long",
alt.var = "alt_id",
choice = "pick",
id.var = "idnum",
sep = "")
me.logit = mlogit (pick ~ price | gender + age + educ + income,
data.logit,
reflevel = 4,
rpar = c("brand1:(intercept)" = "n",
"brand2:(intercept)" = "n",
"brand3:(intercept)" = "n"),
R = 500,
halton = NA,
panel = TRUE)
summary(me.logit)
我得到的结果对我没有意义。对于两个品牌,替代的特定常数(假人的系数)是负的,价格的系数显然也是负的。然后这些品牌的WTP变为负面,这绝对是错误的。
我认为使用mlogit.data
时我分配参数的方式可能有误。