使用高斯族分布来预测GLM中的离散量

时间:2012-07-17 23:41:22

标签: statistics machine-learning gaussian glm discrete-space

使用具有高斯族分布的广义线性模型通过例如将高斯GLM的输出舍入到最接近的整数来预测离散量是否合适(合法方法)?

1 个答案:

答案 0 :(得分:1)

你可以做到这一点,但这可能不是最好的事情。这实际上取决于您尝试建模的数据的性质。很可能,因为回归更适合您的需求。

http://en.wikipedia.org/wiki/Poisson_regression

但是,没有任何东西可以阻止您将线性模型实际拟合到整数值数据,但在使用模型推断数据时可能会遇到问题。如果您只是想提供一个模型来预测未来的观察结果,那么即使理论上没有效果,它也可以很好地工作。

显然,鉴于模型的性质,您可能最终会预测完全荒谬的结果 - 例如,您的响应变量可能仅在有限范围内有意义(比如正整数),但您的模型可以允许预测任意大的值(正面及负面)。残差检查(正态性和相关性)等模型检查步骤可能无法给出在建模连续正态分布响应时通常会看到的结果类型。

总的来说,我会说,根据您的数据,您的方法可以生成有用的预测模型,但一般情况下您应该谨慎行事。

阅读此问题及其中的一些答案 - 它讨论了类似的主题https://stats.stackexchange.com/questions/3024/why-is-poisson-regression-used-for-count-data

为了覆盖更广泛的受众群体,您可以考虑在http://stats.stackexchange.com

发布此问题