我试图通过使用带有以下参数的solve.QP函数(来自quadprog包)来进行优化
R = matrix( c( 2.231113e-05,-4.816095e-05,-5.115287e-05, 0,2.989584e-05,4.212173e-06,0,0, 5.504990e-05), ncol=3, byrow=T)
b = c(-1,0,rep(0,ncol(R)))
C = cbind(rep(1,ncol(R)), diag(ncol(R)))
C = cbind(-rep(1,ncol(R)),C)
d = as.matrix(c(57621264,78057622,171342351),ncol=1)
H = solve.QP(Dmat = R, factorized = TRUE, dvec = d, Amat = C, bvec = b)
但我收到的错误是
Error in solve.QP(Dmat = R, factorized = TRUE, dvec = d, Amat = C, bvec = b) :
constraints are inconsistent, no solution!
但是,当我使用不同的矩阵进行R
时R2 = matrix( c( 0.05365071,-0.06364421,-0.04102565, 0, 0.08423283,-0.04048879,0,0,0.09659707), ncol=3, byrow=T)
solve.QP调用
H = solve.QP(Dmat = R2, factorized = TRUE, dvec = d, Amat = C, bvec = b)
不会造成任何问题。 我现在的问题是,为什么在前一种情况下会出现问题。
非常感谢任何帮助!
答案 0 :(得分:14)
矩阵dvec中的元素非常庞大。矩阵R是Dmat
的cholesky分解中的上三角矩阵的逆,即Dmat = M ^ T M,其中M = R ^ { - 1}。所以以非制造的形式:
M <- solve(R)
Dmat <- t(M)%*%M
Dmat
未被证实是巨大的,与dvec
大致相同:
# [,1] [,2] [,3]
#[1,] 2008893283 3236243201 1619059085
#[2,] 3236243201 6332319710 2522625866
#[3,] 1619059085 2522625866 1641403882
因此,您的问题可能是由于某种溢出错误造成的。要解决此问题,您可以扩展Dmat
(未发布)和dvec
:
sc <- norm(Dmat,"2")
solve.QP(Dmat = Dmat/sc, dvec=d/sc, Amat=C, bvec=b, meq=0, factorized=FALSE )
解决方案是
# $solution
# [1] -1.220832e-17 0.000000e+00 1.043877e-01
与constrOptim
在另一个答案中找到的解决方案很好地匹配。
缩放Dmat
和dvec
很好,因为-d^T b + 1/2 b^T D b
的约束最小值与任何常量sc的约束最小值sc*(-d^T b + 1/2 b^T D b)
相同。
编辑: 要以分解形式解决问题,您可以尝试类似以下缩放:
nn2 = sqrt(norm(d,"2"))
H = solve.QP(Dmat = R*nn2, dvec = d/(nn2^2), Amat = C, bvec = b, factorized=TRUE)
#$solution
#[1] 0.0000000 0.0000000 0.1043877
答案 1 :(得分:3)
也许有两个问题。首先,你没有输入参数meq,它告诉求解器有多少约束方程是等式约束,有多少是不等式,所以它默认为meq = 0,这使得它们都是等式约束所以你已经超定你的解决方案看看你的问题,我可能会猜到至少最后三个限制是不等的;即解决方案载体的组分都应该>接下来,第二个等式似乎有点令人困惑。如果它是一个不等式约束,那么它与后三个是多余的。如果它是等式约束,则它与第一个冲突。也许它不应该存在或应该以某种方式改变。
------------编辑---------------------------------- -----------
我对你的第一篇文章反应太快了,现在明白你所有的约束都是不等式约束,所以你可以使用meq的默认值。在我看来,第二个约束与其余约束是多余的,但这似乎不会导致任何问题,因此它现在不重要。您的编辑也帮助我更好地理解您的问题,并且我同意您使用R矩阵的示例应该可以使用给定的约束来解决。可能是R中矩阵元素的大小可能导致求解问题.QP所以我尝试了一个更通用的非线性约束优化器constrOptim。这为R和R2矩阵提供了解决方案,R2解决方案非常接近R2的solve.QP解决方案。
R2 = matrix( c( 0.05365071,-0.06364421,-0.04102565, 0, 0.08423283,-0.04048879,0,0,0.09659707), ncol=3, byrow=T)
R = matrix( c( 2.231113e-05,-4.816095e-05,-5.115287e-05, 0,2.989584e-05,4.212173e-06,0,0, 5.504990e-05), ncol=3, byrow=T)
d = as.matrix(c(57621264,78057622,171342351),ncol=1)
start <- rep(1/(ncol(R)+1), ncol(R))
min_fn <- function(b, dvec, Dmat) -t(dvec)%*%b +t(b)%*%Dmat%*%b/2
grad_min_fn <- function(b, dvec, Dmat) -dvec + Dmat%*%b
b = c(-1., 0, rep(0,ncol(R)))
C = cbind(rep(1,ncol(R)), diag(ncol(R)))
C = cbind(-rep(1,ncol(R)),C)
D <- t(solve(R))%*%solve(R)
constrOptim(theta=start, f=min_fn, grad=grad_min_fn, ui=t(C), ci=b, control=list(reltol=10*.Machine$double.eps),
dvec=d, Dmat=D )
solve.QP solution for R2
$solution
[1] -1.025463e-10 0.000000e+00 1.000000e+00
constrOptim solution for R2
$par
[1] 2.479855e-15 1.178762e-14 1.000000e+00
以及为R
提供解决方案 $par
[1] 9.272547e-17 5.958225e-14 1.040137e-01
constrOptim提供有关其解决方案路径的更多信息而不是solve.QP,因此可能对数字敏感问题更有帮助。
我不知道constrOptim是否适合您作为solve.QP的替代品,但至少它可以帮助您调查解决问题的属性。