我在R中有两个名为good
和bad
的组(data.frame),它们分别包含好用户和坏用户。
小组good
包含game_id
,这是计算机游戏的ID和number
,这是该游戏的播放次数。
例如good$game_id
我们得到1 2 3 ... 20
。我们有20场比赛。
类似good$number
我们得到45214 1254 23 ... 8914
这是游戏玩过的数字。例如,game_id==1
组中good
已播放45214次。
类似于bad
我们在这两个组中的用户数也相同。
因此对head(good,20)
我们得到
game_id number
1 45214
2 1254
...
20 8914
我想调查固定计算机游戏的播放次数之间是否存在依赖关系。
对于game_id==1
,我会尝试将Pearson的Chi测试用于“独立”。
在R中,我输入chisq.test(good[1,2], bad[1,2])
,查看good
与bad
之间是否存在game_id==1
,但我收到错误消息:x and y must have same levels.
如何解决这个问题?