logit模型中的Scale参数

时间:2013-01-06 08:44:52

标签: statistics regression

在深入了解logit模型时,我偶然发现了一个名为“scale parameter”的东西。有人可以解释一下它是什么以及它用于什么。怎么会没用呢。另外,它也用于probit模型吗?

干杯

2 个答案:

答案 0 :(得分:3)

这是在5个月前提出来的,但无论如何我都会回答。

OP,你可能还记得linear regression的剩余平方和的概念。由此,我们可以通过将残差SS除以剩余自由度来获得模型中误差的标准偏差的统计量。误差的标准偏差也称为比例参数:它是线性回归误差的sigma分布中的N(mu, sigma)

在逻辑回归中,与残差SS的类似统计量是残差偏差:在考虑预测变量的影响后,模型中无法解释的变异量。现在理论上,逻辑回归没有比例参数:注意二项分布中没有等价于sigma的信息。 (回想一下,逻辑回归假设数据是从二项式分布中提取的,其参数p是预测变量的函数。)然而,在实践中,我们经常观察到数据的可变性比可能的多。由模型占。为此调整模型的一种方法是计算“线性回归”中的“比例参数”:剩余偏差除以残差df。

由于过度离散是响应分布的一个属性,因此它对于逻辑运算回归和逻辑分析同样适用。

可以证明,在给定某些假设的情况下,正确指定的逻辑/概率模型中的残差偏差应近似等于残差df:即,尺度参数应约为1.尺度参数的模型> 1被称为过度分散;你可以通过将所有系数的t统计量除以scale参数来实现这一点,就像在线性回归中一样。

请注意,这并不总是有用的规则。这主要取决于每个二项式观察的试验数量很大的假设,这通常会违反实际数据。例如,如果您有二进制响应(每个观察值为0或1),则会完全崩溃。

答案 1 :(得分:0)

我发现它们有点难以理解,所以请耐心等待,但也许我有一些可能对你有用的见解。

首先,如果您还没有,请查看Kenneth Train关于基于模拟的估算的书。在他关于logit的章节中,甚至还有关于scale参数的章节(ch.3.3)。

基本上,它与人们谈论的内容有所不同,所以这取决于你在想什么。 有些人用lambda划分每个选项的整个条件效用。这种lambda通常不会被识别,因为效用的规模是不明确的(只有相对差异很重要)。也许当你提出probit时,你讨论了正常错误项的方差,这是未确定的。

然而,还有其他人在讨论随机实用新型如何通过(混合)logit模型进行近似时讨论它们。从这个意义上讲,这是因为多项logit可以被解释为“平滑”的最大函数。也就是说,如果仅将IID极值误差乘以lambda,那么当lambda - > 0,logum收敛到最大选择(=间接效用)。 Kenneth Train也谈到了这一点,请查看。

编辑:我认为如果你遇到数字问题,实际上要考虑这个问题。例如,我遇到了一些问题,其中某些数据行的大多数条件选择概率为0或1,这给出了可能性问题。使用更高的lambda类型“平滑”概率(在某种意义上,作为lambda - >无穷大,所有CCPs - > 1 / J(其中J =选择的数量))。

希望它有所帮助。