如何通过多个JOINS和多个条件获得多个COUNT?

时间:2015-05-30 14:59:24

标签: mysql

我有SQL(MySQL),我无法弄清楚。该应用程序使用上传的照片,照片中有许多标记的参与者,并且可以在1到5之间投票。

原始查询获得一张照片的所有投票,并按投票数和这些投票的平均数来订购。

现在我需要限制多于一个参与者的照片。因此,不应考虑只有1名参与者的照片。

简化架构如下所示。

PHOTOS
----------------------
| id   | title       |
----------------------
| 1    | Fun stuff   |
| 2    | Crazy girls |
| 3    | Single boy  |


PHOTO_VOTES
-------------------------------------------
| photo_id   | grade    | date  | user_id |
-------------------------------------------
| 1          | 3        | …     | 12      |
| 1          | 3        | …     | 12      |
| 2          | 5        | …     | 14      |
| 2          | 4        | …     | 14      |
| 3          | 4        | …     | 15      |
| 3          | 4        | …     | 18      |


PHOTO_PARTICIPANTS
-------------------------
| photo_id   | user_id  |
-------------------------
| 1          | 12       |
| 1          | 21       |
| 1          | 33       |
| 2          | 14       |
| 2          | 33       |
| 3          | 12       |

这是我走了多远:

SELECT vote.photo_id,
  COUNT(vote.photo_id) AS vote_count,
  AVG(vote.grade) AS vote_average,
  COUNT(pp.photo_id) AS participant_count

 FROM photo_votes vote

  LEFT JOIN photos p ON (vote.photo_id = p.id)
  LEFT JOIN photo_participants pp ON (pp.photo_id = p.id)

  GROUP BY vote.post_id, 
   HAVING vote_count >= 2
   AND vote_average >= 3
   AND participant_count > 1

  ORDER BY count DESC, average DESC;

基本上我想要的最终结果是,只有一位参与者排除了照片:

VOTES
-----------------------------------------------------------
| photo_id   | vote_count     | average  | participant_count
-----------------------------------------------------------
| 1          | 2              | 3        | 3
| 2          | 2              | 4.5      | 2

更新

事实证明,这是一种非常低效的尝试做我想要的方式。下面的Gordons回答确实解决了这个问题,但是一旦我想加入照片表中的字段,“笛卡尔产品” - 问题就变成了一个真正的问题 - 它变成了一个非常沉重和缓慢的查询。

我最终得到的解决方案是在照片表中添加一个缓存字段,跟踪照片中有多少参与者。换句话说,我向每次对参与者表进行更改时正在更新的“照片”添加了“participant_count”字段。我还定期运行一个cron-job,以确保所有照片'participant_count'都是最新的。

1 个答案:

答案 0 :(得分:2)

首先,您不需要left join。但这不应影响结果。问题是你有一个笛卡尔积,因为你与照片有两个1-n关系:投票和参与者。

解决此问题的正确方法是使用子查询:

SELECT pv.photo_id, pv.vote_count, pv.vote_average, pp.participant_count
FROM (SELECT pv.photo_id, count(*) AS vote_count, avg(grade) AS vote_average
       FROM photo_votes pv
       GROUP BY pv.photo_id
      ) pv 
JOIN
      (SELECT pp.photo_id, count(*) AS participant_count
       FROM photo_participants p;
       GROUP bY pv.photo_id
      ) pp
      ON pv.photo_id = pp.photo_id
WHERE pv.vote_count >= 2 AND
      pv.vote_average >= 3 AND
      pp.participant_count > 1
ORDER BY pv.vote_count DESC, pv.vote_average DESC;

请注意,您甚至不需要photos表,因为您没有使用其中的任何字段。