我有两个长度相同的向量a
和b
。向量包含游戏的播放次数。因此,例如,在群组265350
中玩a
时,游戏1已在52516
中播放b
。
a <- c(265350, 89148, 243182, 208991, 113090, 124698, 146574, 33649, 276435, 9320, 58630, 20139, 26178, 7837, 6405, 399)
b <- c(52516, 42840, 60571, 58355, 46975, 47262, 58197, 42074, 50090, 27198, 45491, 43048, 44512, 27266, 43519, 28766)
我想用Pearsons Chi square test来测试两个向量之间的独立性。在R I中键入
chisq.test(a,b)
我得到一个p值0.2348意味着这两个向量是独立的(H是真的)。
但是当我运行pairwise.prop.test(a,b)
并得到所有成对p值并且几乎所有它们都非常低时,意味着两个向量之间存在成对依赖关系,但这与第一个结果形成对比。怎么可能 ?
答案 0 :(得分:1)
pairwise.prop.test
不适合您的情况。
正如文档中提到的那样:
计算成对比例之间的成对比较,并进行多次测试校正
还有:
x (第一个参数)。
成功计数的矢量或带有2列的矩阵分别给出成功和失败的计数。
和
n (第二个参数)。
试验计数向量;如果x是矩阵,则忽略。
因此,x
中n
的成功次数是试验,即x <=(小于或等于)n中的每一对。这就是pairwise.prop.test
用于比例的原因。举一个例子,想象一下投掷一枚硬币1000次,获得头部550. x将是550,n将是1000.在你的情况下,你没有类似的东西,你只有两组游戏的数量。
测试独立性的正确假设检验是您已经使用的chisq.test(a,b)
,我相信这一点。