optim / constrOptim中的错误“'vmmin'中的初始值不是有限的”

时间:2012-04-30 11:21:56

标签: r

我的问题(以及我认为可以帮助解决它的问题)被解释为“FOR REPRODUCTION”行。之后我发布了我的代码,以防再现可能有助于解决它。

我使用optim和constrOptim.nl来解决我写的函数g(见下文)中的约束的优化问题。

我知道下面使用的初始值并不理想,但我选择了它们 因为它们导致我在较短的程序中面临的问题。我使用这个程序来校准数据的模型参数,这也会出现更好的初始值,更高的公差等问题。

错误

我用我写的函数get_par调用:

v<-c(0.12504710,0.09329359,0.06778733, 0.04883216, 0.04187344,0.02886261,0.02332951,0.02178576,0.02282214,0.02956336,0.03478598)
Ti=1/12
x<-log(cbind(0.8,0.85,0.9,0.95,0.975,1,1.025,1.05,1.1,1.15,1.2))

g(par2=c(-5,5),v=v,Ti=Ti,x=x)

然后我得到

Error in optim: inital value 'vmmin' is not finite.

到目前为止我观察到的内容

所以我开始调试我的代码以找出这个错误发生的确切位置。错误发生在行中的函数g(见下文)中(值为sigma = 5,m = -5,y =(x-m)/ sigma,vtilde = v / 12)

#print(paste("vW: sigma: ",sigma,"mv:",mv))

argmin<-constrOptim.nl(par=c(3*sigma,sigma,mv/2),fn=f,hin.jac=hinv.jac,
hin=hinv,heq.jac=heqv.jac,heq=heqv,control.outerlist(trace=T),
control.optim=list(abstol=10^(-10)),y=y,vtilde=vtilde,sigma=sigma)

功能constrOptim.nl的跟踪显示

Outer iteration:  18 
Min(hin):  1.026858e-19 Max(abs(heq)):  0 
par:  10 9.99998 1.02686e-19 
fval =   6399 

用于最后一次迭代。我想在最后一次迭代中出现了1.02686e-19的某种数值问题。

我查看了函数constrOptim.nl和albama(带有debug()),错误恰好出现在行中

theta.old <- theta
atemp <- optim(par = theta, fn = fun, gr = grad, control = control.optim, 
    method = "BFGS", hessian = TRUE, ...)

其中theta = theta.old的值为

Browse[2]> theta.old
[1]  1.000002e+01  9.999985e+00 -3.349452e-20

因此它有一个刚好低于零的条目(它的绝对值甚至小于机器精度,不是吗?)。

当你看到函数乐趣时,你意识到它调用了函数

R:
function (theta, theta.old, ...) 
{
gi <- hin(theta, ...)
if (any(gi < 0)) 
    return(NaN)
gi.old <- hin(theta.old, ...)
hjac <- hin.jac(theta.old, ...)
bar <- sum(gi.old * log(gi) - hjac %*% theta)
if (!is.finite(bar)) 
    bar <- -Inf
fn(theta, ...) - mu * bar
}

hin(theta,...)= hinv(theta,...)返回带有否定条目的向量,因此该函数返回NaN。我认为这应该导致错误消息:“错误优化:初始值'vmmin'不是有限的”。我现在的问题是:

我该如何解决?我曾想过当这些小值出现时强制程序以某种方式终止,但我还没有设法做到这一点。你有什么建议?

非常感谢,

FOR REPRODUCTION:

这是我的计划:

函数hinv,hinv.jac,heq和heq.jac仅用于约束。我优化的功能是g。

library(alabama)
library(dfoptim)

#function f, par = (c,d,atilde)
f<-function(par3,y,vtilde,sigma){
sum((par3[3]+par3[2]*y+par3[1]*sqrt(y^2+1)-vtilde)^2)
}

#Equality/Inequality constraints

heqv<-function(par3,y,vtilde,sigma){

J1<-matrix(1/2*cbind(sqrt(2),sqrt(2),-sqrt(2),sqrt(2)),nrow=2,ncol=2) 
J2<-matrix(0,nrow=3,ncol=3)
J2[1:2,1:2]<-J1
J2[3,3]<-1

j<-J2%*%par3
j[2]-2*sqrt(2)*sigma
}

#Jacobian-matrix
hinv.jac<-function(par3,y,vtilde,sigma){

#J1, J2: Drehungen für die constraints
J1<-matrix(1/2*cbind(sqrt(2),sqrt(2),-sqrt(2),sqrt(2)),nrow=2,ncol=2) 
J2<-matrix(0,nrow=3,ncol=3)
J2[1:2,1:2]<-J1
J2[3,3]<-1

hjac<-matrix(cbind(1,-1,0,0,0,0,0,0,0,0,1,-1),nrow=4)%*%J2
hjac
}

hinv<-function(par3,y,vtilde,sigma){

#J1, J2: Drehungen für die constraints
J1<-matrix(1/2*cbind(sqrt(2),sqrt(2),-sqrt(2),sqrt(2)),nrow=2,ncol=2) 
J2<-matrix(0,nrow=3,ncol=3)
J2[1:2,1:2]<-J1
J2[3,3]<-1

j<-J2%*%par3
h<-rep(NA,4)
h[1]<- j[1]
h[2]<- sqrt(2)*2*sigma-j[1]
h[3]<-j[3]
h[4]<-max(vtilde)-j[3]
h
}

#Jacobian-matrix
heqv.jac<-function(par3,y,vtilde,sigma){
#J1, J2: Drehungen für die constraints
J1<-matrix(1/2*cbind(sqrt(2),sqrt(2),-sqrt(2),sqrt(2)),nrow=2,ncol=2) 
J2<-matrix(0,nrow=3,ncol=3)
J2[1:2,1:2]<-J1
J2[3,3]<-1

cbind(J2[2,1],J2[2,2],0)
}

#function g input: par2= (m,sigma): optimization of function f

g<-function(par2,v,Ti,x){


#definition of parameters being used
m<-par2[1]
sigma<-par2[2]
y<-(x-m)/sigma #Transformation von x zu y gemäß paper
vtilde<-Ti*v
mv<-max(vtilde)

#print(paste("vW: sigma: ",sigma,"mv:",mv))
argmin<-constrOptim.nl(par=c(3*sigma,sigma,mv/2),fn=f,hin.jac=hinv.jac,hin=hinv,heq.jac=heqv.jac,heq=heqv,control.outer=list(trace=F),control.optim=list(abstol=10^(-10)),y=y,vtilde=vtilde,sigma=sigma)
argmin$par
}

0 个答案:

没有答案