Question

在我的统计分析中，我比较了样本对问题2的回答（Y / N）的可能性，给出了对问题1的答案（是/否）。

millenials_q1q2 <- matrix(c(25, 150, 100, 25),ncol=2, byrow=FALSE)
babyboomers_q1q2 <- matrix(c(100,75,60,60),ncol=2, byrow=FALSE)

我已经能够使用proptable来绘制行和列百分比图表：

prop.table(test_data1, 1)
prop.table(test_data1, 2)

prop.table(test_data2, 1)
prop.table(test_data2, 2)

我希望做的是直接比较两个矩阵，以评估两种模式之间差异的重要性。

我希望这有意义，并提供足够的背景！

编辑（进一步背景）：

我按人口统计（即千禧一代，婴儿潮一代）对数据集进行了子集化，并且我有兴趣探索这些子样本是否/如何以不同方式回答Q1和Q2。

上面的矩阵代表了他们如何回答问题的明显差异，我对衡量这种差异感兴趣。（比如说，下面的相似矩阵相比）

millenials_same <- matrix(c(55, 45, 55, 45),ncol=2, byrow=FALSE)
babyboomers_same <- matrix(c(57, 44, 53, 46),ncol=2, byrow=FALSE)

这有助于澄清我的问题吗？谢谢！

Answer 1

假设这些矩阵具有配对数据，您可以构建每对差异的置信区间。

创建矩阵＆＃34; D＆＃34;值为test_data1-test_data2（第一项为＆＃34; D＆＃34;为test_data1 [1] -test_data2 [1]）
在＆＃34; D＆＃34;

有关步骤2的更多详细信息，请参见此处：http://www.cyclismo.org/tutorial/R/confidence.html

如果置信区间不包括＆＃34; 0＆＃34;，您可以说没有证据表明这些值的差异无关紧要。