我想估计由Sarhan和Apaloo(2013)引入的具有最大似然估计(MLE)的指数修正威布尔扩展(EMWE)分布的四个参数。该分布用于可靠性和生存分析,以分析具有浴缸危险功能的数据集。
因为四个参数的对数似然函数的一阶导数给出了隐式解,所以我尝试继续使用Newton-Raphson迭代方法。只是我不熟悉确定这种方法的良好初始猜测,因为我的主要关注点是如何选择正确的初始猜测以获得浴缸危险功能。我使用R,这里是代码:
#Parameter Estimation
xi<-c(3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,8,8,8,8,8,8,8,8,9,9,9,9,9,10,10,11,12,12,14)
n<-length(xi)
log_likelihood<-function(theta){
n*(log(theta[1])+log(theta[2])+log(theta[3])+(1-theta[2])*log(theta[4])+theta[1]*theta[4])+(theta[2]-1)*sum(log(xi))+(1/(theta[4]^theta[2]))*sum(xi^theta[2])-(theta[1]*theta[4])*sum(exp((xi/theta[4])^theta[2]))+(theta[3]-1)*sum(1-(exp((theta[1]*theta[4])*(1-(exp((xi/theta[4])^theta[2]))))))
}
result<-nlm(log_likelihood,theta<-c(0.000030763,2.2011,0.11878,6),hessian=TRUE)
&#13;
我意识到在任何优化问题中,都没有系统选择初始猜测。但是,在最大似然问题中,一个常见的选择是选择与观测数据的经验矩(均值,方差等)相匹配的初始参数,因此我选择:
theta[1]=0.0000022011
theta[2]=1.1878
theta[3]=0.21669
theta[4]=6.4941
其中theta[1]
和theta[4]
是比例参数,theta[2]
和theta[3]
作为形状参数,结果如下:
result
____________________
$minimum
[1] -1167.797
$estimate
[1] 1.540561e-06 1.187800e+00 2.166900e-01 6.494100e+00
$gradient
[1] 4.251830e+07 7.312058e+01 3.922662e+02 -1.815774e+01
$hessian
[,1] [,2] [,3] [,4]
[1,] -2.977361e+10 -7.455449e+02 1.093871e+03 3.396184e+02
[2,] -7.455449e+02 -5.215852e+01 6.316999e-04 -2.725559e+01
[3,] 1.093871e+03 6.316999e-04 -1.808591e+03 -2.906025e-04
[4,] 3.396184e+02 -2.725559e+01 -2.906025e-04 5.665718e+00
$code
[1] 2
$iterations
[1] 1
&#13;
估计的参数是:
theta[1]=1.540561e-06
theta[2]=1.1878
theta[3]=2.166900e-01
theta[4]=6.4941
要获得危险函数图,我使用以下代码:
#The estimated parameters
p1=theta[4]
p2=theta[2]
p3=theta[3]
p4=theta[1]
#Hazard Function
hazard_EMWE=(p4*p2*p3*((xi/p1)^(p2-1))*(exp(((xi/p1)^(p2))+(p4*p1*(1-(exp((xi/p1)^(p2)))))))*((1-(exp((p4*p1*(1-(exp((xi/p1)^(p2))))))))^(p3-1)))/(1-(((1-(exp((p4*p1*(1-(exp((xi/p1)^(p2))))))))^(p3))))
#Cumulative Distribution Function
cum_EMWE=((1-(exp((p4*p1*(1-(exp((xi/p1)^(p2))))))))^(p3))
#Hazard Function Plot
plot(xi,hazard_EMWE,type="l" ,main="Hazard Function Plot",xlab="x",ylab="Hazard Function",col = "black",lty=1,lwd=3,ylim=c(0.005,0.008))
&#13;
这是情节: bathtub hazard plot
实际上,该图显示了浴缸危险曲线,但我认为我选择了不良的初始猜测,因此累积分布函数与经验分布函数严重不同。这意味着数据不遵循EMWE分布,而我的期望是数据必须遵循EMWE分布。
累积分布函数和经验分布函数如下所示: cumulative distribution function and empirical distribution function
所以我的问题与我使用的初始猜测有关。这可能是糟糕的初始价值。这里有没有人有选择这个数据集的良好初始猜测的解决方案?