我有一个计数数据向量强烈过度分散且零膨胀。
矢量看起来像这样:
i.vec=c(0,63,1,4,1,44,2,2,1,0,1,0,0,0,0,1,0,0,3,0,0,2,0,0,0,0,0,2,0,0,0,0,
0,0,0,0,0,0,0,0,6,1,11,1,1,0,0,0,2)
m=mean(i.vec)
# 3.040816
sig=sd(i.vec)
# 10.86078
我想对此进行分配,我强烈怀疑这是一个零膨胀的泊松(ZIP)。但我需要进行显着性测试,以证明ZIP分布符合数据。
如果我有正态分布,我可以使用包vcd中的函数goodfit()进行卡方拟合度测试,但我不知道我可以对零膨胀数据执行任何测试。 / p>
答案 0 :(得分:17)
这是一种方法
# LOAD LIBRARIES
library(fitdistrplus) # fits distributions using maximum likelihood
library(gamlss) # defines pdf, cdf of ZIP
# FIT DISTRIBUTION (mu = mean of poisson, sigma = P(X = 0)
fit_zip = fitdist(i.vec, 'ZIP', start = list(mu = 2, sigma = 0.5))
# VISUALIZE TEST AND COMPUTE GOODNESS OF FIT
plot(fit_zip)
gofstat(fit_zip, print.test = T)
基于此,它看起来不像ZIP是合适的。