我正在尝试拟合累积分布的对数 - 对数图
网络到三种模型之一:指数(P(k)~e^(-ak))
,
指数截断幂律(P(k)~k^(a-1)e^(k/kc))
和幂
法律(P(k)~k^-a)
。我知道这是一个低信息测试,但我是
只是试图确定三种模型中哪一种最适合
(或者可能是最糟糕的合适!)
我在Excel表格中有logCPK
(B列)的网络和
三个模型的拟合值(C列,D列和E列)。我有
还计算了总平方和(SST)(F列),然后
三个模型的误差平方和(SSE)(G,H列,
和我)。
对于这三种模型中的每一种,我都计算了1-(sum(SSE)/sum(SST))
估计每个的简单线性回归的R ^ 2值
模型,在Excel底部以黄色突出显示
片。所以,现在我有三个R ^ 2值(幂律= 0.507,指数
= 0.777,指数截断幂律= 0.899)。
起初,似乎指数截断的幂律是最好的 适合(最高R ^ 2值)。但是,我不确定如何解释 惩罚指数截断的幂律具有的事实 自由度为2,而另外两个模型有度数 自由1。
当我联系其他统计数据时,我被告知应该这样做 使用“似然比检验”。从我对此的理解来看, 最佳拟合对其“对数似然”的负值最小。 然而,指数截断的幂律将会出现 最初的“对数似然”的最小负值(因为它有两个 df,其他两个型号只有一个df),所以我必须测试 在考虑到之后,它是否真的保持负面影响 自由度。
我想我知道如何在Excel中理论上计算 的一部分:
1)使用其中A为
的chidist(A,B)2*(log.likelihood of Exponentially
truncated - log.likelihood of Power law)
和B是df的差异 (2-1 = 1)。如果p值小于0.05,那么指数 截断确实比Power法明显更合适。 2)使用其中A为
的chidist(A,B)2*(log.likelihood of Exponentially
truncated - log.likelihood of Exponential)
和B是不同的 df(2-1 = 1)。如果p值小于0.05,那么指数 截断真的比指数更适合。
然后我可以得出结论哪种模型最合适。
这就是我的问题所在(取决于我的想法 以上是正确的),怎么去计算 日志(可能性)?我已经搜索过了,但我还是迷路了。它似乎 这个手工计算是一个野兽(除非我可以简单地使用 我在Excel中已有的东西),所以我也在询问软件。
另一种选择是计算AIC(也向我建议),尽管如此
我相信我仍然会遇到同样的问题,我需要计算
AIC等式(AIC = 2k - 2ln(L))
的对数(似然)。
所以我的具体问题是如何计算AIC和/或日志(可能性) 对于这三个模型,可以直接从我在Excel中使用或使用 软件
提前谢谢!
PS:我已经研究过R编程,看到它有AI {stats}和 logLik {stats}功能,但我不明白文档 我是否拥有运行这些功能所需的所有输入信息, 如果是的话,如何运行它。答案 0 :(得分:0)
对于幂律,您可以使用以下公式和指南:
Newman MEJ (2005) Power laws, Pareto distributions and Zipf’s law.
Contemporary Physics 46: 323–351. doi:10.1080/00107510500052444.
或
Xiao X, White E, Hooten M, Durham S (2011) On the use of log-transformation vs.
nonlinear regression for analyzing biological power-laws. Ecology 92: 1887–1894.
doi:10.1890/11-0538.1.
他们有一个在线附录,其中包含R
中的代码之后,您将了解如何与其他发行版一起使用。