我试图估计客户在一段时间后活着的概率。我有500家公司客户的数据。对于每个客户,我知道x(给定客户在所有时间段内的交易数量),tx(上次交易的时间)和T(第一次购买和观察窗口结束之间的总时间)。
我使用BG / NBD模型。为了估计活着的概率,我首先需要估计该模型中包含的4个参数(r,alpha,a和b)。为了优化这些参数的值,我使用的是«bbmle»包(如下所示)。
然而,当我运行代码时,它不会给出任何结果。此外,R似乎也不承认下面函数中包含的许多“对象”。
有没有人注意到我在代码中犯了任何错误?还有其他方法可以写吗?
bgLlh <- function(mydata, r, alpha, a, b) {
with (mydata, {
if (a<=0 | b<=0 | r<=0 | alpha<=0) return (NaN)
term1 <-log(gamma(r+mydata$x)) - log(gamma(r)) + r*log(alpha)
term2 <-log(gamma(a+b))+log(gamma(b+mydata$x))-log(gamma(b))-log(gamma(a+b+mydata$x))
term3<- -(r+mydata$x)*log(alpha+mydata$T)
term4 <- if(mydata$x > 1) {log(a)-log(b+mydata$x-1)-(r+mydata$x)*log(alpha+mydata$tx)
} else {0}
llh <- term1 + term2 +log(exp(term3)+(mydata$x>0)*exp(term4))
f <- -sum(llh)
return(f)
})
}
bgEstimateParameters <- function(mydata, initValues, safeMode=FALSE) {
llhd <- function(r, alpha, a, b) {
return (bgLlh(data, r, alpha, a, b))
}
library(bbmle)
if (safeMode) {
fit <- mle2(llhd, initValues, skip.hessian=TRUE, method="Nelder-Mead")
} else {
fit <- mle2(llhd, initValues)
}
return (fit)
}