什么R包可用于二进制数据,它们是相关的还是群集的?

时间:2010-02-02 16:58:06

标签: r statistics sas

我现在正在开展一个项目,这与我之前做过的事情完全不同。我有两个测试,二元结果将被管理到相同的样本,这是从聚类人群中抽取的(即,一些科目来自同一家庭)。我想比较一下阳性测试结果的比例,但聚类会使McNemar的测试不合适,所以我一直在阅读其他方法。两条主要路线似乎是1)由Rao和Scott(1992),Eliasziw和Donner(1991),Obuchowski(1998)和2)GEE进行聚类调整的McNemar替代方案。

你知道R中Rao-Obuchowski血统的任何实现(或者,我想,SAS)? GEE很容易找到,但您对任何特定包有积极或消极的体验吗?还有另一条分析这些数据的途径我完全没有了吗?

提前感谢您的帮助 - 如果需要澄清,请告诉我。

4 个答案:

答案 0 :(得分:3)

您可以随时使用群集引导程序。对您认为独立的家庭进行重新取样。也就是说,重新采样时,请将家人聚在一起。为每个样本计算p2 - p1。经过1000次左右的迭代后,计算上下2.5%的分位数。这将为您提供95%置信区间的自举。或者,计算高于零的样本分数,或者无论您的假设是什么。除非家庭数量很少,否则该程序应具有良好的良好性能。

在R中手动执行此操作可能最简单,而不是依赖于任何程序包。

答案 1 :(得分:2)

查看survey包:它旨在考虑群集抽样引起的相关性。

答案 2 :(得分:2)

您是否已检查过R中的CorrBin包裹? 它用于分析相关的二进制数据,Szabo有一篇名为Using the CorrBin package for nonparametric analysis of correlated binary data的论文,它包括Rao-Scott,随机排序和基于GEE的测试的三个版本。

答案 3 :(得分:1)

群集二进制匹配对数据的clust.bin.pair包最近发布到CRAN。

它包含了Eliasziw和Donner(1991)和Obuchowski(1998)的实现,以及同一家族Durkalski(2003)和Yang(2010)中最近的两个测试。