在R中包含data1
和game
的数据集times
。有6个游戏,times
只是告诉我们data1
游戏的播放时间。所以head(data1)
给了我们
game times
1 850
2 621
...
6 210
类似于data2
我们得到
game times
1 744
2 989
...
6 711
而sum(data1$times)
略高于sum(data2$times)
。我们在data1
中有大约2000个用户,data2
中有大约1000个用户,但我认为这些信息不相关。
我想比较两个数据集,看看是否存在统计上的差异以及哪个游戏"导致"那个差异。
我应该使用哪两种测试来比较它们。在这种情况下,我不认为Pearson chisq.test
是正确的选择,也许wilcox.test
是选择的权利?