R:两个随机变量的列联表

时间:2014-02-11 07:21:11

标签: r statistics probability

我有两个Beta变量 B1(8,5) B2(4,7),我为每个变量生成了1000个样本。

如果我不得不使用双向列联表来测试两组样本的独立性,

1)使用列联表是否合适?

2)正确接近这个的任何指针?

(我创建了一个频率表,但我看到的只是这个 - 所有X的样本按行排列,Y的所有样本按列排列,0遍每个单元格写入)

1 个答案:

答案 0 :(得分:1)

Beta随机变量可以从0到1连续取任何值。所以一个简单的列联表没有多大意义。

你可以查看协方差,或绘图,或者对数据进行分区,然后查看列联表。也许像是

> set.seed(1)
> B1 <- rbeta(1000, shape1=8, shape2=5)
> B2 <- rbeta(1000, shape1=4, shape2=7)
> cov(B1,B2)
[1] 0.0003400774
> plot (B1,B2)
> CT <- table(cut(B1,4), cut(B2,4))
> print(CT)

                (0.0518,0.246] (0.246,0.44] (0.44,0.635] (0.635,0.829]
  (0.214,0.401]             15           30           11             3
  (0.401,0.587]             77          173           83            12
  (0.587,0.774]            106          231          126            20
  (0.774,0.96]              25           54           30             4
> chisq.test(CT)

        Pearson's Chi-squared test

data:  CT 
X-squared = 2.4747, df = 9, p-value = 0.9816

Warning message:
In chisq.test(CT) : Chi-squared approximation may be incorrect