在我的统计分析中,我比较了样本对问题2的回答(Y / N)的可能性,给出了对问题1的答案(是/否)。
millenials_q1q2 <- matrix(c(25, 150, 100, 25),ncol=2, byrow=FALSE)
babyboomers_q1q2 <- matrix(c(100,75,60,60),ncol=2, byrow=FALSE)
我已经能够使用proptable来绘制行和列百分比图表:
prop.table(test_data1, 1)
prop.table(test_data1, 2)
prop.table(test_data2, 1)
prop.table(test_data2, 2)
我希望做的是直接比较两个矩阵,以评估两种模式之间差异的重要性。
我希望这有意义,并提供足够的背景!
编辑(进一步背景):
我按人口统计(即千禧一代,婴儿潮一代)对数据集进行了子集化,并且我有兴趣探索这些子样本是否/如何以不同方式回答Q1和Q2。
上面的矩阵代表了他们如何回答问题的明显差异,我对衡量这种差异感兴趣。 (比如说,下面的相似矩阵相比)
millenials_same <- matrix(c(55, 45, 55, 45),ncol=2, byrow=FALSE)
babyboomers_same <- matrix(c(57, 44, 53, 46),ncol=2, byrow=FALSE)
这有助于澄清我的问题吗?谢谢!
答案 0 :(得分:0)
假设这些矩阵具有配对数据,您可以构建每对差异的置信区间。
有关步骤2的更多详细信息,请参见此处:http://www.cyclismo.org/tutorial/R/confidence.html
如果置信区间不包括&#34; 0&#34;,您可以说没有证据表明这些值的差异无关紧要。