应用错误收集

什么R包可用于二进制数据，它们是相关的还是群集的？

时间：2010-02-02 16:58:06

标签： r statistics sas

我现在正在开展一个项目，这与我之前做过的事情完全不同。我有两个测试，二元结果将被管理到相同的样本，这是从聚类人群中抽取的（即，一些科目来自同一家庭）。我想比较一下阳性测试结果的比例，但聚类会使McNemar的测试不合适，所以我一直在阅读其他方法。两条主要路线似乎是1）由Rao和Scott（1992），Eliasziw和Donner（1991），Obuchowski（1998）和2）GEE进行聚类调整的McNemar替代方案。

你知道R中Rao-Obuchowski血统的任何实现（或者，我想，SAS）？ GEE很容易找到，但您对任何特定包有积极或消极的体验吗？还有另一条分析这些数据的途径我完全没有了吗？

提前感谢您的帮助 - 如果需要澄清，请告诉我。

4 个答案:

答案 0 :(得分：3)

您可以随时使用群集引导程序。对您认为独立的家庭进行重新取样。也就是说，重新采样时，请将家人聚在一起。为每个样本计算p2 - p1。经过1000次左右的迭代后，计算上下2.5％的分位数。这将为您提供95％置信区间的自举。或者，计算高于零的样本分数，或者无论您的假设是什么。除非家庭数量很少，否则该程序应具有良好的良好性能。

在R中手动执行此操作可能最简单，而不是依赖于任何程序包。

答案 1 :(得分：2)

查看survey包：它旨在考虑群集抽样引起的相关性。

答案 2 :(得分：2)

您是否已检查过R中的CorrBin包裹？它用于分析相关的二进制数据，Szabo有一篇名为Using the CorrBin package for nonparametric analysis of correlated binary data的论文，它包括Rao-Scott，随机排序和基于GEE的测试的三个版本。

答案 3 :(得分：1)

群集二进制匹配对数据的clust.bin.pair包最近发布到CRAN。

它包含了Eliasziw和Donner（1991）和Obuchowski（1998）的实现，以及同一家族Durkalski（2003）和Yang（2010）中最近的两个测试。