在Windows 7下64位R的优化问题

时间:2011-04-18 20:26:18

标签: windows optimization r 64-bit

我目前正处于开发我的第一个R软件包的最后阶段,该软件包应该适用于多项处理树(MPT)模型(请参阅当前版本的homepage)。模型拟合由R optim函数实现 今天我第一次在Windows 7机器上玩它并注意到一些非常奇怪的事情:optim在使用64位版本的R时没有成功收敛。这看起来像是一个bug(特别是对我来说) nlminb收敛于两个R版本)。由于optim是我的软件包的核心,因此非常感谢您对此问题的任何帮助。

这是一个最小可重复的例子(通常模型是通过表达式指定的,而不是在目标函数中指定,但为了简单起见,我将所有内容放在目标函数中):

# The objective function:
llk.tree <- function (Q, data) 
{
    p <- Q[1]
    q <- Q[2]
    r <- Q[3]
    e <- rep(NA,4)
    e[1] <- p * q * r
    e[2] <- p * q * (1-r)
    e[3] <- p * (1-q) * r
    e[4] <- p * (1-q) * (1-r) + (1-p)

    llk <- sum(data * log(e))
    if (is.na(llk)) 
        llk <- -1e+19
    if (llk == -Inf) 
        llk <- -1e+19
    return(-llk)
}

# The call to optim:
optim(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3))

此示例从seminal paper on MPTs by Riefer & Batchelder再现示例,即表1中的第1行。 327(预期参数值为p = 1,q = .49,r = .30)。

在32位R 始终上运行它会得到正确的结果(尝试使用版本2.12.2和2.13.0):

$par
[1] 1.0000000 0.4944449 0.3000001

$value
[1] 234.7110

$counts
function gradient 
      11       11 

$convergence
[1] 0

$message
[1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH"

(请注意,由于随机起始值,计数可能会有所不同。)

另一方面,在64位R上运行它可能会产生这样一个(错误的)结果:

$par
[1] 0.8668081 0.6326655 0.1433857

$value
[1] 257.7328

$counts
function gradient 
       3        3 

$convergence
[1] 0

$message
[1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH"

目标函数的返回值和返回的参数值在每次运行时都不同,但count总是3!

请注意,运行nlminb会在32位和64位R上生成正确的结果:

nlminb(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), lower = 0, upper = 1)

$par
[1] 1.0000000 0.4944445 0.3000000

$objective
[1] 234.711

$convergence
[1] 0

$iterations
[1] 14

$evaluations
function gradient 
      19       55 

$message
[1] "relative convergence (4)"

最后一点说明:我们有一些例子(这是我们最简单的示例模型),它适用于64位R和optim,但更多示例(如此处所示)不起作用。

计数总是3 ......

修改

修正起始​​值时(感谢Joshua Ulrich)optim不会偏离64位R下的固定值:

optim(c(0.5, 0.5, 0.5), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3))

$par
[1] 0.5 0.5 0.5

$value
[1] 276.1238

$counts
function gradient 
       3        3 

$convergence
[1] 0

$message
[1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH"

1 个答案:

答案 0 :(得分:3)

我们今天做了一些测试,发现了与Linux下使用64位R的问题中描述的相同的问题。

但是,感谢Joachim Vandekerckhove这个巧妙的想法,我们尝试了一个简单的改变来解决问题(虽然这个问题仍然存在疑问)。在llkInf的目标函数结束时,我们将其设置为极高值(1e19)。
使用较小的值(例如1e10)可以消除64位计算机上的问题(到目前为止在Linux上进行了测试):

llk.tree <- function (Q, data) 
{
    p <- Q[1]
    q <- Q[2]
    r <- Q[3]
    e <- rep(NA,4)
    e[1] <- p * q * r
    e[2] <- p * q * (1-r)
    e[3] <- p * (1-q) * r
    e[4] <- p * (1-q) * (1-r) + (1-p)

    llk <- sum(data * log(e))
    if (is.na(llk)) 
        llk <- -1e+10
    if (llk == -Inf) 
        llk <- -1e+10
    return(-llk)
}

# The call to optim:
optim(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3))

这会返回正确的结果!