我在Cross Validated上提出了这个问题,但我想我可能没有得到帮助,因为这更像是一个编程问题,而不是统计学的理论/解释。
我正在尝试使用R中的mlogit
包,并一直在关注如何获取数据的边际效应。提供的示例使用连续变量,但我想知道如何使用分类解释变量。
我有一个风险值,它是一个连续的协变量,但我也有年龄,阶级和性别作为协变量。我希望看到女性的边缘效应"只有或者是#34;年轻 - 女性"在风险方面。我该怎么做?
帮助文件说:
z <- with(Fish, data.frame(price = tapply(price, index(m)$alt, mean),
catch = tapply(catch, index(m)$alt, mean),
income = mean(income)))
# compute the marginal effects (the second one is an elasticity
effects(m, covariate = "income", data = z)
effects(m, covariate = "price", type = "rr", data = z)
effects(m, covariate = "catch", type = "ar", data = z)
我不确定如何操纵z
数据框以获得女性或年轻女性的平均风险,从而能够计算边际效应。我会分开做吗?我是否以某种方式按年龄划分数据框(比如说我只有2个年龄段:年轻人和老年人),这样我就可以为年轻人提供1个数据框,为旧版提供一个单独的新数据框,然后计算平均风险?
我希望从我自己的数据中获得的是能够解释生成我的后代类别的可能性的大小。举个例子,我想说的是,如果风险增加1个单位,老年女性产生2个后代的可能性增加10%。由于风险增加1个单位,年轻女性产生2个后代的可能性增加15%。
我不确定如何手动计算边际效应,因此对于如何获得一个包来为我做这件事感到困惑。我也一直在nnet
库或VGAM
尝试,但这些似乎都没有提供很多帮助。
答案 0 :(得分:0)
我得到了一个答案 - 不确定它是否是最好的,但它确实有效。我感兴趣的协变量恰好是两个类 - 这意味着我可以将协变量转换为二进制0,1数字响应。因此,当我重新运行代码时,我可以计算出这个“分类”变量的平均值。
但是,我认为我忽略了这种边际效应的观点,并且可能正在使用它或试图错误地解释它。