nls fit中用于启动参数的线性模型

时间:2019-02-16 02:09:02

标签: r transform linear-regression nls

我读到有关使用日志代替创建线性方程式的信息,这样我就可以从线性方程式的R中提取nls拟合的起始值; 因此,

对于等式:Y = q /(1 + bDX)^(1 / b)其中Y和X是我的数据; q,b,D是我要估计的参数。我创建了线性模型:

  X<-1:45
  Y <- c(35326L, 30339L, 23379L, 21877L, 18629L, 17627L, 15691L, 15435L, 
   14205L, 11732L, 10560L, 10592L, 9939L, 7491L, 4928L, 3427L, 8123L, 
   9027L, 8733L, 9599L, 8737L, 9135L, 8548L, 7279L, 8940L, 8459L, 
   8460L, 7700L, 6817L, 7167L, 7089L, 7091L, 7538L, 9206L, 9680L, 
   5876L, 7799L, 8384L, 10586L, 8623L, 7848L, 5534L, 6610L, 6539L, 
   6650L)
lmodel <- coef(lm(log(Y)~X+I(X^2)))   
q0 <- exp(lmodel[1])
D0 <- -lmodel[2]
b0 <- lmodel[3]*2/D0^2 
Start1=list(q=q0,b=b0,D=D0)
theta_hat2 <- nls(y~q*(1+b*D*x)^(-1/b),start=Start1) 

这每次都会为我提供所需的结果。但是,我想让nls适应下面提到的其他一些方程式,这对我来说相当困难。如果有人可以帮助我建立一个适合这些的线性模型,我将不胜感激。

等式2:

Y=q*(-D+(b/n)*X^n here q,b,D,n are to be estimated.

等式3:

Y=q*exp⁡(-(X/D)^b here q,b,D are to be estimated.

等式4:

Y=q*X^((-b) )*exp⁡(D/((1-b) )*(X^(1-b)-1) here q,b,D are to be estimated.

我为此问题附加了示例数据集here

1 个答案:

答案 0 :(得分:1)

主要问题是等式(2)和(4)被过度参数化,因此无论使用哪种优化算法,都会出现问题。在(3)的情况下,存在语法错误,我们需要更好的起始值。测试输入应包含在问题中,我们在末尾的注释中提供了该输入。

方程式(1)

xy应该是XY。我们可以使用plinear算法来避免必须为线性参数q指定起始值,在这种情况下,其他参数的起始值1就足够了。

fo1 <- Y ~ (1+b*D*X)^(-1/b)
fm1 <- nls(fo1, start = list(D = 1, b = 1), alg = "plinear")

方程式(2)

方程式(2)的参数过大,因为如果将q乘以任意数字a,并且同时用右手除以D和b,则不会改变。删除q时,我们注意到D和b线性输入,只有n实际上是非线性的,因此我们可以使用plinear算法来避免线性参数的初始值:

fo2 <- Y ~ cbind(-1,(1/n)*X^n)
fm2 <- nls(fo2, start = list(n = 1), alg = "plinear")

方程式(3)

问题中给出的公式中缺少右括号。如果我们解决这个问题,那么问题就在于我们需要更好的初始价值。首先尝试将b固定为1,然后将结果用作完整方程式的起始值。再次使用plinear避免为线性参数提供起始值。

fo3 <- Y ~ exp(-(X/D)^b)
b <- 1
fm <- nls(fo3, start = list(D = 1), alg = "plinear")
fm3 <- nls(fo3, start = list(D = coef(fm)[["D"]], b = 1), alg = "plinear")

方程式(4)

方程式(4)的参数也过高,因此将D设置为1-b,在这种情况下exp(D /(1-b))是常数exp(1),因此:

fo4 <- Y ~ X^((-b))* exp(1) * (X^(1-b)-1)
fm4 <- nls(fo4, start = list(b = .5), alg = "plinear")

比较

我们可以绘制各种解决方案:

plot(Y ~ X, pch = 20)
lines(fitted(fm1) ~ X)
lines(fitted(fm2) ~ X, col = "red")
lines(fitted(fm3) ~ X, col = "blue")
lines(fitted(fm4) ~ X, col = "green")
legend("topright", legend = 1:4, lty = 1,  col = c("black", "red", "blue", "green"))

screenshot

注意

测试数据应包含在问题中,由于未以该形式提供,因此我们这次将在此处提供:

X <- 1:45
Y <- c(35326L, 30339L, 23379L, 21877L, 18629L, 17627L, 15691L, 15435L, 
14205L, 11732L, 10560L, 10592L, 9939L, 7491L, 4928L, 3427L, 8123L, 
9027L, 8733L, 9599L, 8737L, 9135L, 8548L, 7279L, 8940L, 8459L, 
8460L, 7700L, 6817L, 7167L, 7089L, 7091L, 7538L, 9206L, 9680L, 
5876L, 7799L, 8384L, 10586L, 8623L, 7848L, 5534L, 6610L, 6539L, 
6650L)