用于计算幂律,指数和指数截断幂律的AIC的软件

时间:2012-11-16 17:22:22

标签: statistics

我正在尝试拟合累积分布的对数 - 对数图 网络到三种模型之一:指数(P(k)~e^(-ak)), 指数截断幂律(P(k)~k^(a-1)e^(k/kc))和幂 法律(P(k)~k^-a)。我知道这是一个低信息测试,但我是 只是试图确定三种模型中哪一种最适合 (或者可能是最糟糕的合适!)

我在Excel表格中有logCPK(B列)的网络和 三个模型的拟合值(C列,D列和E列)。我有 还计算了总平方和(SST)(F列),然后 三个模型的误差平方和(SSE)(G,H列, 和我)。

对于这三种模型中的每一种,我都计算了1-(sum(SSE)/sum(SST)) 估计每个的简单线性回归的R ^ 2值 模型,在Excel底部以黄色突出显示 片。所以,现在我有三个R ^ 2值(幂律= 0.507,指数 = 0.777,指数截断幂律= 0.899)。

起初,似乎指数截断的幂律是最好的 适合(最高R ^ 2值)。但是,我不确定如何解释 惩罚指数截断的幂律具有的事实 自由度为2,而另外两个模型有度数 自由1。

当我联系其他统计数据时,我被告知应该这样做 使用“似然比检验”。从我对此的理解来看, 最佳拟合对其“对数似然”的负值最小。 然而,指数截断的幂律将会出现 最初的“对数似然”的最小负值(因为它有两个 df,其他两个型号只有一个df),所以我必须测试 在考虑到之后,它是否真的保持负面影响 自由度。

我知道如何在Excel中理论上计算 的一部分:

1)使用其中A为

的chidist(A,B)
2*(log.likelihood of Exponentially
truncated - log.likelihood of Power law)

和B是df的差异 (2-1 = 1)。如果p值小于0.05,那么指数 截断确实比Power法明显更合适。 2)使用其中A为

的chidist(A,B)
2*(log.likelihood of Exponentially
truncated - log.likelihood of Exponential)

和B是不同的 df(2-1 = 1)。如果p值小于0.05,那么指数 截断真的比指数更适合。

然后我可以得出结论哪种模型最合适。

这就是我的问题所在(取决于我的想法 以上是正确的),怎么去计算 日志(可能性)?我已经搜索过了,但我还是迷路了。它似乎 这个手工计算是一个野兽(除非我可以简单地使用 我在Excel中已有的东西),所以我也在询问软件。

另一种选择是计算AIC(也向我建议),尽管如此 我相信我仍然会遇到同样的问题,我需要计算 AIC等式(AIC = 2k - 2ln(L))的对数(似然)。

所以我的具体问题是如何计算AIC和/或日志(可能性) 对于这三个模型,可以直接从我在Excel中使用或使用 软件

提前谢谢!

PS:我已经研究过R编程,看到它有AI {stats}和 logLik {stats}功能,但我不明白文档 我是否拥有运行这些功能所需的所有输入信息, 如果是的话,如何运行它。

1 个答案:

答案 0 :(得分:0)

对于幂律,您可以使用以下公式和指南:

Newman MEJ (2005) Power laws, Pareto distributions and Zipf’s law. 
Contemporary Physics   46: 323–351. doi:10.1080/00107510500052444.

Xiao X, White E, Hooten M, Durham S (2011) On the use of log-transformation vs. 
nonlinear regression for analyzing biological power-laws. Ecology 92: 1887–1894.
doi:10.1890/11-0538.1.

他们有一个在线附录,其中包含R

中的代码

之后,您将了解如何与其他发行版一起使用。