使用带零的“Metafor”记录响应率

时间:2016-10-13 19:00:30

标签: r plyr

我在R中使用'metafor'包来执行日志响应比率。我的一些方法是零,这似乎是我的escalc命令之后发出警告的原因(因为log(0)是-inf)。 metafor包提供了一种将小值添加到零的方法,以避免这种情况。文档说明:

“具有零的单元格条目可能会有问题,特别是对于相对风险和优势比。向2×2表格的单元格添加一个小常量是此问题的常见解决方案[...]何时= “only0”,add的值仅在那些至少有一个单元格等于0的表中添加到2×2表的每个单元格中。“

由于某些原因,这不能解决我的错误,也许是因为我的数据不是2x2表? (它是从ply包中的ddply汇总输出,类似于this example中的格式)。我必须手动用少量数字替换零值,还是有更优雅的方式? (请注意,在此示例中,零值的行也具有1的样本大小,因此没有方差,并且无论如何都将从分析中删除。我只想知道它对未来的作用。)

可重复的例子:

dat<-dput(Bin_Y_count_summary_wide)
structure(list(Species.ID = c("CAFERANA", "TR11", "TR118", "TR500", 
"TR504", "TR9", "TR9_US1"), Y_num_mean.early = c(2, 147.375, 
4.5, 0.5, 12.5, 93.4523809523809, 5), N.early = c(1L, 4L, 2L, 
4L, 4L, 7L, 2L), sd.early = c(NA, 174.699444284558, 6.36396103067893, 
1, 22.4127939653523, 137.506118190001, 7.07106781186548), se.early = c(NA, 
87.3497221422789, 4.5, 0.5, 11.2063969826762, 51.9724274972283, 
5), Y_num_mean.late = c(0, 3.625, 2.98482142857143, 0.8, 3, 47.2, 
0), N.late = c(1L, 4L, 7L, 10L, 10L, 8L, 1L), sd.late = c(NA, 
7.25, 5.10407804830748, 1.75119007154183, 8.03118920210451, 40.7351024477486, 
NA), se.late = c(NA, 3.625, 1.9291601697265, 0.553774924194538, 
2.53968501984006, 14.4020335865659, NA), Y_num_mean.wet = c(NA, 
71.5, 0, 12, 27, 0, NA), N.wet = c(NA, 2L, 1L, 2L, 2L, 2L, NA
), sd.wet = c(NA, 17.6776695296637, NA, 9.89949493661167, 38.1837661840736, 
0, NA), se.wet = c(NA, 12.5, NA, 7, 27, 0, NA)), row.names = c(NA, 
7L), .Names = c("Species.ID", "Y_num_mean.early", "N.early", 
"sd.early", "se.early", "Y_num_mean.late", "N.late", "sd.late", 
"se.late", "Y_num_mean.wet", "N.wet", "sd.wet", "se.wet"), class = "data.frame", reshapeWide = structure(list(
    v.names = c("Y_num_mean", "N", "sd", "se"), timevar = "early_or_late", 
    idvar = "Species.ID", times = c("early", "late", "wet"), 
    varying = structure(c("Y_num_mean.early", "N.early", "sd.early", 
    "se.early", "Y_num_mean.late", "N.late", "sd.late", "se.late", 
    "Y_num_mean.wet", "N.wet", "sd.wet", "se.wet"), .Dim = c(4L, 
    3L))), .Names = c("v.names", "timevar", "idvar", "times", 
"varying")))

# Warning produced from this command
test <- escalc(measure="ROM", m1i=Y_num_mean.early, sd1i=sd.early, n1i=N.early, m2i=Y_num_mean.late, sd2i=sd.late, n2i=N.late, data=dat, add=1/2, to="only0")

1 个答案:

答案 0 :(得分:1)

您引用的段落适用于可以根据2x2表计算的度量(即RRORRDAS和{{1 }})。 PETOadd参数对toSMD等措施没有任何影响。

比率标度变量(使用响应比假定)的唯一方法是,如果每个值都等于0,那么,根据定义,方差也必须为0。适用于样本量是否为1(在这种情况下,方差当然也为0)或者您是否有更大的样本量。

通常,只要两个均值中的至少一个为0,就无法计算对数响应比。当然,人们可以开始手动为手段添加某种常量(对于SD也是如此),但这似乎相当随意。我们可以对2x2表中的计数进行调整是基于统计理论的(这些调整实际上是偏差减少,这也恰好使得在计数0时可以计算某些度量)。