我有两个Beta变量 B1(8,5)和 B2(4,7),我为每个变量生成了1000个样本。
如果我不得不使用双向列联表来测试两组样本的独立性,
1)使用列联表是否合适?
2)正确接近这个的任何指针?
(我创建了一个频率表,但我看到的只是这个 - 所有X的样本按行排列,Y的所有样本按列排列,0遍每个单元格写入)
答案 0 :(得分:1)
Beta随机变量可以从0到1连续取任何值。所以一个简单的列联表没有多大意义。
你可以查看协方差,或绘图,或者对数据进行分区,然后查看列联表。也许像是
> set.seed(1)
> B1 <- rbeta(1000, shape1=8, shape2=5)
> B2 <- rbeta(1000, shape1=4, shape2=7)
> cov(B1,B2)
[1] 0.0003400774
> plot (B1,B2)
> CT <- table(cut(B1,4), cut(B2,4))
> print(CT)
(0.0518,0.246] (0.246,0.44] (0.44,0.635] (0.635,0.829]
(0.214,0.401] 15 30 11 3
(0.401,0.587] 77 173 83 12
(0.587,0.774] 106 231 126 20
(0.774,0.96] 25 54 30 4
> chisq.test(CT)
Pearson's Chi-squared test
data: CT
X-squared = 2.4747, df = 9, p-value = 0.9816
Warning message:
In chisq.test(CT) : Chi-squared approximation may be incorrect