R中的nls():评估模型时产生缺失值或无穷大

时间:2018-11-22 05:34:28

标签: r nls

我正在尝试使用nls(),但是出现了问题中的错误。

以下是示例数据集类似于原始数据集:

rh1 = rnorm(301, 0.75, 0.1)
rh1[rh1 > 1] = 1
ta1 = rnorm(301, 302, 3)
y1 = rnorm(301, 0.2, 0.05)

df_test = data.frame(rh1 = rh1,
                 rh2 = c(NA, rh1[-c(1)]),
                 ta1 = ta1,
                 ta2 = c(NA, ta1[-c(1)]),
                 y1 = y1,
                 y2 = c(NA, y1[-c(1)]))
df_test = df_test[-c(1), ] # this function cannot estimate for the first value

其中rh是空气的相对湿度, ta是空气温度,单位为K, y是物体的水分。 1表示今天的价值; 2表示昨天的值。

我正尝试通过以下模型使用y2,rh1&2和ta1&2估算y:

nls(y1 ~
  coef1 ^ 2 * y2 +
  coef1 * (1 - coef1) * 
  (coef2 + coef3 * log(-8.3 * ta2 * log(rh2) / 18)) +
  (1 - coef1) * 
  (coef2 + coef3 * log(-8.3 * ta1 * log(rh1) / 18)),
data = df_test,
algorithm = "port",
start = list(coef1 = 0.7,
             coef2 = 0.15,
             coef3 = 0),
upper = c(exp(-0.00005), Inf, Inf),
lower = c(exp(-0.5), Inf, Inf))

Coef1、2和3是要估计的参数。

通过手动计算确定第一行数据的初始值。

但是此脚本在标题中出现了错误。

  

缺少值或评估模型时产生的无穷大

我还尝试根据以下链接使用minpack.lm :: nlsLM()函数:

nls troubles: Missing value or an infinity produced when evaluating the model

library(minpack.lm)
nlsLM(y1 ~
    coef1 ^ 2 * y2 +
    coef1 * (1 - coef1) * 
    (coef2 + coef3 * log(-8.3 * ta2 * log(rh2) / 18)) +
    (1 - coef1) * 
    (coef2 + coef3 * log(-8.3 * ta1 * log(rh1) / 18)),
  data = df_test,
  start = list(coef1 = 0.7,
               coef2 = 0.15,
               coef3 = 0),
  upper = c(exp(-0.00005), Inf, Inf),
  lower = c(exp(-0.5), Inf, Inf))

但仍然出现相同的错误。

1 个答案:

答案 0 :(得分:3)

这里有几个问题。

首先,您的滞后值并不是真正的滞后。看看df_test,您会发现12相同。
这将为您提供滞后的值:

set.seed(1)

rh1 <- rnorm(301, 0.75, 0.1)
rh1[rh1 > 1] <- 1
ta1 <- rnorm(301, 302, 3)
y1 <- rnorm(301, 0.2, 0.05)

df_test <- data.frame(
  rh1 = rh1,
  rh2 = c(NA, head(rh1, -1)),
  ta1 = ta1,
  ta2 = c(NA, head(ta1, -1)),
   y1 = y1,
   y2 = c(NA, head(y1, -1))
)
df_test <- df_test[complete.cases(df_test), ]

下一步:

  

缺少值或评估模型时产生的无穷大

如此,我的眼睛立即注视着表情中的log。我们都知道,取负数的对数和0的对数是不确定的,尽管它通常以无穷大返回。

让我们看看这些表达式

ex1 <- with(df_test, log(-8.2 * ta2 * log(rh2) / 18))
ex2 <- with(df_test, log(-8.3 * ta1 * log(rh1) / 18))

如果您查看ex1ex2,您将看到它们都包含-Inf。现在是您的罪魁祸首。但是,我们该如何解决呢?让我们看看数据中哪些行会引起这种情况。

df_test[which(is.infinite(ex1 + ex2)),]
#        rh1     rh2      ta1      ta2      y1      y2
# 274 1.0000 0.66481 304.5453 300.5972 0.20930 0.17474
# 275 0.7656 1.00000 304.9603 304.5453 0.20882 0.20930

有趣的是,它们彼此相邻,并且都包含一个1log(1)是什么?如果将其乘以某值并取乘积的对数,会发生什么?

让我们确保rh1rh2始终小于1

set.seed(1)

rh1 <- rnorm(301, 0.75, 0.1)
rh1[rh1 > 0.99] <- 0.99
ta1 <- rnorm(301, 302, 3)
y1 <- rnorm(301, 0.2, 0.05)

df_test <- data.frame(
  rh1 = rh1,
  rh2 = c(NA, head(rh1, -1)),
  ta1 = ta1,
  ta2 = c(NA, head(ta1, -1)),
   y1 = y1,
   y2 = c(NA, head(y1, -1))
)
df_test <- df_test[complete.cases(df_test), ]

但是我们仍然没有完成。如果您现在运行nls()呼叫,则会收到错误

  

收敛失败:初始面值违反约束条件

如果查看为系数约束指定的值,则原因很明显。 coef2coef3的约束较低,设置为无穷大!那没有道理。 “初始par违反约束”通常意味着起始值不在约束内,在这里肯定是这种情况。如果我们将它们更改为负无穷大,则一切正常。

nls(y1 ~
  coef1 ^ 2 * y2 +
  coef1 * (1 - coef1) * 
  (coef2 + coef3 * log(-8.3 * ta2 * log(rh2) / 18)) +
  (1 - coef1) * 
  (coef2 + coef3 * log(-8.3 * ta1 * log(rh1) / 18)),
  data = df_test,
  algorithm = "port",
  start = list(coef1 = 0.7,
               coef2 = 0.15,
               coef3 = 0),
  upper = c(exp(-0.00005), Inf, Inf),
  lower = c(exp(-0.5), -Inf, -Inf)
)
# Nonlinear regression model
#    model: y1 ~ coef1^2 * y2 + coef1 * (1 - coef1) * (coef2 + coef3 * log(…
#    data: df_test
#   coef1   coef2   coef3 
#  0.6065  0.2569 -0.0170 
#  residual sum-of-squares: 1.058

# Algorithm "port", convergence message: 
#   both X-convergence and relative convergence (5)