在R中创建列联表的问题

时间:2020-01-16 02:15:15

标签: r statistics data-science

我正在使用ISLR软件包进行统计。我正在使用OJ数据集。我正在尝试为购买人口列和特殊价格列创建列联表。

我正在尝试查找有特殊价格的CH被出售的可能性。

到目前为止,这是我的代码。

library(ISLR)
CH <- table(OJ[OJ$Purchase == 'CH', "SpecialCH"])
MM <- table(OJ[OJ$Purchase == 'MM', "SpecialMM"])
table (MM, CH)

我得到的结果有点奇怪。

     CH
MM    121 532
  101   1   0
  316   0   1

我试图找到赔率,并最终应用McNemar的检验。但是我无法生成列联表。我可以手工完成,但需要在R中完成。

1 个答案:

答案 0 :(得分:0)

您正在尝试使用3个变量,但是列联表仅使用2。我建议使用System.ComponentModel,因为公式方法可以节省一些键入内容,并且可以更好地标记表:

xtabs

第一张桌子问这个问题。是一个品牌与另一个品牌相关的特价商品。 OJ有1070笔采购。 CH进行158次特殊比赛,而MM进行173次特殊比赛。但是两个品牌都只有4次特别优惠。该表表明MM和CH不在同一时间。您可以使用Chi Square或其他测试来查看这是否与随机分配的特殊商品有显着差异。

第二张表和第三张表查看OJ的购买情况,以查看某个品牌相对于另一品牌在销售时是否更有可能被购买。请注意,大多数OJ购买都发生在都不销售的情况下,但可能是销售促进了对销售品牌的购买。统计测试再次会告诉您这是随机的机会还是不太可能的机会。