我有一个PostgreSQL表,它主要是一个桥接表,但它也有一些额外的东西。
基本上它包含有关游戏中玩家的信息。所以我们在这个游戏玩家实例中有一个唯一的id。然后是游戏桌的FK的id,以及玩家桌的FK的id。还有一些其他无关紧要的东西。像这样:
Table players_games
| id | 12564
| player_id | 556
| game_id | 156184
我想要做的是找出一个玩家与另一个玩家玩多少次。所以,如果player1与player2在同一个游戏中,他们一起玩过一次。游戏中有2个以上的玩家。
所以我要做的就是填充一个新表,它包含三个值:player_lo,player_hi,times_played。
要么每对都有一行和它们播放的次数,要么它最终效率更高,每次迭代都有一行,并将值设置为1,这样这些可以在以后加在一起,也许是分布式的。所以你可能会看到类似的东西:
p1, p2, 1
p1, p2, 1
以后这些会减少到:
p1, p2, 2
所以我想知道是否有一些聪明的方法可以使用SQL,或者如果有SQL可以减少我的编程工作量,那么在开始编写一个稍微复杂的python脚本之前就可以了。
答案 0 :(得分:3)
select p1, p2, count(*) from (
select
pg1.player_id as p1, pg1.game_id, pg2.player_id as p2
from
players_games pg1, players_games pg2
where
pg1.game_id = pg2.game_id and pg1.player_id != pg2.player_id
) foo
group by p1, p2
请注意,这会在players_games
上执行完全联接,因此如果表很大,它可能会非常慢。获得计数的关键部分是group by
。
答案 1 :(得分:2)
为此,您需要在player_games表上进行自我加入。第一个子查询用于第一个玩家,第二个子查询用于第二个玩家。 “第一”玩家是玩家ID较低的玩家。
select pg1.player_id as player1, pg2.player_id as player2, count(*) as num_games
from (select distinct game_id, player_id
from players_games pg
) pg1 join
(select distinct game_id, player_id
from players_games pg
) pg2
on pg1.game_id = pg2.game_id and
pg1.player_id < pg2.player_id
group by pg1.player_id, pg2.player_id
请注意,连接条件使用“&lt;”在播放器ID上。这是为了防止重复计数(因此玩家A,B也不算作B,A)。
另外,我在内部子查询中添加了“distinct”,以防单个玩家在给定游戏中出现多次。也许这不是必要的。可以肯定的是,你应该在复合键game_id,player_id。
上有一个唯一索引答案 2 :(得分:0)
SET search_path='tmp';
DROP TABLE players_game CASCADE;
CREATE TABLE players_game
( game_id INTEGER NOT NULL
, player_id INTEGER NOT NULL
);
INSERT INTO players_game(game_id,player_id) VALUES
(1,100) ,(1,101) ,(2,100) ,(2,101)
,(3,100) ,(3,101) ,(4,102) ,(4,101)
;
WITH pair AS (
SELECT g1.player_id AS p1
, g2.player_id AS p2
FROM players_game g1
JOIN players_game g2 ON g1.game_id = g2.game_id
WHERE g1.player_id < g2.player_id
)
SELECT pa.p1 , pa.p2, COUNT(*) AS num_games
FROM pair pa
GROUP BY p1, p2
ORDER BY num_games DESC
;
结果:
SET
ERROR: table "players_game" does not exist
CREATE TABLE
INSERT 0 8
p1 | p2 | num_games
-----+-----+-----------
100 | 101 | 3
101 | 100 | 3
102 | 101 | 1
101 | 102 | 1
(4 rows)