在sparkR中,我有一个DataFrame data
。它包含user
,game
。
user
包含用户,game
包含用户玩过的游戏名称。只有14场比赛,分别是1,2,......,14。
所以
head(data)
给出了这个输出
user game
3521 3
52 14
865 4
52 3
我想找到固定用户正在玩的第一款游戏。例如,用户52玩游戏14 3 3 5 10,这里游戏14是该用户正在玩的第一个游戏。
在sparkR中我这样做
su <- groupBy(data, data$user)
sus <- agg(su, FirstPlayed= first(data$game))
# Making it local
local_sus <- collect(sus)
这里我得到了正确的结果,因为我可以在sparkR中使用first
函数。
我想找到第二个&#39;和第三个&#39;用户玩过的游戏,但我无法做到这一点,因为sparkR没有&#34;第二个&#34;功能
如何解决它 - 也许我应该使用except
- 函数来删除第一个元素?