我在一年的时间里有一系列日级动物计数(有些日子有多次测量,有些没有测量)。存在时间趋势,并且可变性取决于y值(=当计数高时更高)。我需要估计总年度中位数,置信区间为95%。在我尝试的事情中:估计每日中位数(从模型中,也预测非采样天数的中位数),然后在每天内进行自举以获得每日95%CI(以估计中位数的百分比表示)。计算年度中位数%CI,并应用于每日中位数的总和以获得年度%CI。这本来是有效的,但我每天都有太少的样本使引导程序无法防御。
我是否应重新取样数据并重新设定模型以获得(比方说)每日估计1,000个中位数,然后使用这些来计算每日95%CI?
与我的结构类似的模拟数据:
set.seed(0)
x <- 1:365
id <- sample(1:365, 200, replace = TRUE)
y0 <- exp(-1 + 0.1 * x[id] - 0.0004 * x[id]^2)
y <- y0 + rnorm(200, 0, y0/5)
plot(x[id], y)
有什么建议吗?