我目前正处于开发我的第一个R软件包的最后阶段,该软件包应该适用于多项处理树(MPT)模型(请参阅当前版本的homepage)。模型拟合由R optim
函数实现
今天我第一次在Windows 7机器上玩它并注意到一些非常奇怪的事情:optim
在使用64位版本的R时没有成功收敛。这看起来像是一个bug(特别是对我来说) nlminb
收敛于两个R版本)。由于optim
是我的软件包的核心,因此非常感谢您对此问题的任何帮助。
这是一个最小可重复的例子(通常模型是通过表达式指定的,而不是在目标函数中指定,但为了简单起见,我将所有内容放在目标函数中):
# The objective function:
llk.tree <- function (Q, data)
{
p <- Q[1]
q <- Q[2]
r <- Q[3]
e <- rep(NA,4)
e[1] <- p * q * r
e[2] <- p * q * (1-r)
e[3] <- p * (1-q) * r
e[4] <- p * (1-q) * (1-r) + (1-p)
llk <- sum(data * log(e))
if (is.na(llk))
llk <- -1e+19
if (llk == -Inf)
llk <- -1e+19
return(-llk)
}
# The call to optim:
optim(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3))
此示例从seminal paper on MPTs by Riefer & Batchelder再现示例,即表1中的第1行。 327(预期参数值为p = 1,q = .49,r = .30)。
在32位R 始终上运行它会得到正确的结果(尝试使用版本2.12.2和2.13.0):
$par
[1] 1.0000000 0.4944449 0.3000001
$value
[1] 234.7110
$counts
function gradient
11 11
$convergence
[1] 0
$message
[1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH"
(请注意,由于随机起始值,计数可能会有所不同。)
另一方面,在64位R上运行它可能会产生这样一个(错误的)结果:
$par
[1] 0.8668081 0.6326655 0.1433857
$value
[1] 257.7328
$counts
function gradient
3 3
$convergence
[1] 0
$message
[1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH"
目标函数的返回值和返回的参数值在每次运行时都不同,但count总是3!
请注意,运行nlminb
会在32位和64位R上生成正确的结果:
nlminb(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), lower = 0, upper = 1)
$par
[1] 1.0000000 0.4944445 0.3000000
$objective
[1] 234.711
$convergence
[1] 0
$iterations
[1] 14
$evaluations
function gradient
19 55
$message
[1] "relative convergence (4)"
最后一点说明:我们有一些例子(这是我们最简单的示例模型),它适用于64位R和optim
,但更多示例(如此处所示)不起作用。
计数总是3 ......
修改
修正起始值时(感谢Joshua Ulrich)optim
不会偏离64位R下的固定值:
optim(c(0.5, 0.5, 0.5), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3))
$par
[1] 0.5 0.5 0.5
$value
[1] 276.1238
$counts
function gradient
3 3
$convergence
[1] 0
$message
[1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH"
答案 0 :(得分:3)
我们今天做了一些测试,发现了与Linux下使用64位R的问题中描述的相同的问题。
但是,感谢Joachim Vandekerckhove这个巧妙的想法,我们尝试了一个简单的改变来解决问题(虽然这个问题仍然存在疑问)。在llk
为Inf
的目标函数结束时,我们将其设置为极高值(1e19
)。
使用较小的值(例如1e10
)可以消除64位计算机上的问题(到目前为止在Linux上进行了测试):
llk.tree <- function (Q, data)
{
p <- Q[1]
q <- Q[2]
r <- Q[3]
e <- rep(NA,4)
e[1] <- p * q * r
e[2] <- p * q * (1-r)
e[3] <- p * (1-q) * r
e[4] <- p * (1-q) * (1-r) + (1-p)
llk <- sum(data * log(e))
if (is.na(llk))
llk <- -1e+10
if (llk == -Inf)
llk <- -1e+10
return(-llk)
}
# The call to optim:
optim(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3))
这会返回正确的结果!