R,比较两个2x2矩阵/表之间差异的显着性

时间:2016-02-29 17:04:04

标签: r matrix statistics

在我的统计分析中,我比较了样本对问题2的回答(Y / N)的可能性,给出了对问题1的答案(是/否)。

millenials_q1q2 <- matrix(c(25, 150, 100, 25),ncol=2, byrow=FALSE)
babyboomers_q1q2 <- matrix(c(100,75,60,60),ncol=2, byrow=FALSE)

我已经能够使用proptable来绘制行和列百分比图表:

prop.table(test_data1, 1)
prop.table(test_data1, 2)

prop.table(test_data2, 1)
prop.table(test_data2, 2)

我希望做的是直接比较两个矩阵,以评估两种模式之间差异的重要性。

我希望这有意义,并提供足够的背景!

编辑(进一步背景):

我按人口统计(即千禧一代,婴儿潮一代)对数据集进行了子集化,并且我有兴趣探索这些子样本是否/如何以不同方式回答Q1和Q2。

上面的矩阵代表了他们如何回答问题的明显差异,我对衡量这种差异感兴趣。 (比如说,下面的相似矩阵相比)

millenials_same <- matrix(c(55, 45, 55, 45),ncol=2, byrow=FALSE)
babyboomers_same <- matrix(c(57, 44, 53, 46),ncol=2, byrow=FALSE)

这有助于澄清我的问题吗?谢谢!

1 个答案:

答案 0 :(得分:0)

假设这些矩阵具有配对数据,您可以构建每对差异的置信区间。

  1. 创建矩阵&#34; D&#34;值为test_data1-test_data2(第一项为&#34; D&#34;为test_data1 [1] -test_data2 [1])
  2. 在&#34; D&#34;
  3. 中构建值的均值的置信区间

    有关步骤2的更多详细信息,请参见此处:http://www.cyclismo.org/tutorial/R/confidence.html

    如果置信区间不包括&#34; 0&#34;,您可以说没有证据表明这些值的差异无关紧要。