如何估算R中的潜在类logit模型?

时间:2020-05-06 22:09:09

标签: r reshape mlogit varying

我对使用R是陌生的。我试图使用面板数据来估计潜在类logit模型。我尝试按照以下示例操作:https://rpubs.com/msarrias1986/335556
有人告诉我下面的代码应该起作用:

df01 <- mlogit.data(data, 
                      id = "ID", 
                      choice = "Choice", 
                      varying = 3:17, 
                      shape = "wide", 
                      sep = "")

lc <- gmnl(Choice ~ COST + REN + NUCL + OUTAGE180 + OUTAGE360 | 0 | 0 | 0 | 1 , 
           data = df01,
           model = 'lc', 
           Q = 3, 
           panel = TRUE,
           method = "bhhh")

具有17列的基本数据文件(参见图片),它可以工作。但是,当我再添加一列(例如性别的虚拟变量)时,会出现2个错误:

  1. 在第一个命令中,出现错误“ reshapeLong(数据,idvar = idvar,timevar = timevar,variable =变异,错误:'varying'参数必须具有相同的长度”的错误。我注意到我可以通过声明'varying = list(3:18)'而不是'varying = 3:18'来消除错误,但是我不确定这是否是正确的处理方法。

    < / li>
  2. 在第二个命令中,出现错误“ eval(predvars,data,env)中的错误:找不到对象'COST'”。 “ COST”确实不是变量,但“ COST_1”(即第一个替代方案的费用),“ COST_2”和“ COST_3”是变量。我希望“成本”的系数表示选择替代方案时成本的重要性。这对于所有其他变量都是相似的。

我很好奇,仅向数据文件添加1列会导致这些错误。我希望有人能提供一些好的建议。感谢您的帮助!

(包含的图像中的数据示例)。

enter image description here

1 个答案:

答案 0 :(得分:0)

我保留了'varying = 3:17'命令,并将代码更改为:

df01 <- mlogit.data(data, 
                      id = "ID", 
                      choice = "Choice",
                      varying = 3:17, 
                      shape = "wide", 
                      sep = "",
                      alt.levels = c("FOSS","REN","NUCL","COST","OUTAGE"))

lc <- gmnl(Choice ~ COST + REN + NUCL + OUTAGE | MALE | 0 | 0 | 1 , 
           data = df01,
           model = 'lc', 
           Q = 3, 
           panel = TRUE,
           method = "bhhh")

对于少于13个单个变量,这似乎起作用。