对于大学项目,我试图将需求的回归模型拟合到许多自变量中。我试图包含一个小例子,但它并没有作为一个数字(因为我是新手)。相反,请参阅以下链接以查看我正在使用的数据集的示例:
在此表中,第一列表示国家/地区对,第2列到第6列是独立变量,最后一列是从属变量。我想做的是进行回归分析,假设这个数据可以用引力方程来描述。
我知道人们经常使用log-linearisation来解决这个问题。但是,因为我在处理数据中的零(并且不要通过添加小常量来扭曲数据),并且我假设异方差性在数据中,我想使用不同的方法。根据Santos 2006所描述的内容(在他的论文"重力日志")中,我想使用泊松伪最大似然估计。
然而,我对使用R(或任何统计软件)相当新,我无法弄清楚如何在R中这样做。任何人都可以帮我这个吗?到目前为止我唯一发现的是glm命令poisson和quasipoisson可以使用(https://stat.ethz.ch/pipermail/r-help/2010-September/252476.html)。
我在glm的文档中寻求帮助,但我不明白如何使用glm函数来解决这个引力模型?如何在表单中指定我想要的模型:
DEM = RP^alpha1 * GDPC_O^alpha2 * GDPC_D^alpha3 * POP_O^alpha4....
然后使用回归来解决不同的alphas?
答案 0 :(得分:1)
很难说没有更多细节,但是
glm(DEM ~ log(RP) + log(GDPC_O) + log(GDPC_D) + log(POP_O),
data=your_data,
family=quasipoisson(link="log"))
应该运作得相当好。截距将是比例常数的对数;其他系数将是指数
相应的术语(这是有效的,因为日志链接表示log(DEM) = beta_0 + beta_1*log(RP) + ...
;如果你对双方进行取幂,则会得到DEM = exp(beta_0) * exp(log(RP)*beta_1) * ...
或DEM = C*RP^beta_1*...
PS没有必要,但解释可能有助于缩放和居中预测变量。