在MySQL查询中随机混合的记录排序

时间:2013-07-15 17:57:51

标签: mysql random django-models sql-order-by mysql-python

我正在寻找一种特殊的要求来自我对MySQL数据库的查询,我想以不同的方式应用排序。例如。在包含字段 user_id user_rating 以及 user_department 的数据库中,包含以下数据。

+------------------------------------------------------+
|      user_id    |   user_rating  |  user_department  |
+------------------------------------------------------+
|         1       |        102     |         A         |
|         2       |        33      |         B         |
|         3       |        43      |         C         |
|         4       |        54      |         A         |
|         5       |        63      |         A         |
|         6       |        214     |         B         |
|         7       |        82      |         A         |
|         8       |        87      |         C         |
|         9       |        43      |         A         |
|         10      |        98      |         A         |
|         11      |        73      |         C         |
|         12      |        31      |         A         |
+------------------------------------------------------+

鉴于上述结构,我想按照 user_rating 的顺序对 each_department 对结果进行排序,我需要每个user_department最多5条记录,其中最初的3条记录应该是按照他们的评级顺序,休息2应该是随机的。

所以在上面的例子中,输出将类似于:

+------------------------------------------------------+
|      user_id    |   user_rating  |  user_department  |
+------------------------------------------------------+
|         1       |       102      |         A         |
|         10      |        98      |         A         |
|         7       |        82      |         A         |
|         12      |        31      |         A         |
|         5       |        63      |         A         |
|         6       |       214      |         B         |
|         2       |        33      |         B         |
|         8       |        87      |         C         |
|         11      |        73      |         C         |
|         3       |        43      |         C         |
+------------------------------------------------------+

我尝试通过网络提供自定义顺序的选项,比如使用FIELD功能但是在这里找不到那么多用处。还尝试使用子查询解决它,但该选项也看起来不可行,因为MySql不允许我在查询中一起使用IN和LIMIT关键字。

有没有更好/更简单的方法来解决这个问题。

1 个答案:

答案 0 :(得分:1)

这不是您正在寻找的,但它提供了一种方法。

我们的想法是使用group_concat()将每个部门的前5个值放在一个列中。此列的格式为:

user_id:rating

重复五次,用逗号分隔。如:

1:182,10:98,7:82,12:31,5:63

执行此操作的查询是:

select user_department,
       substring_index(group_concat(concat(user_id, ':', user_rating)
                                    order by user_rating desc
                                   ), ',', 5)
from t
group by user_department;

这不处理最后两个值的随机化。它把一切都放在一排。但是,我认为这可能会有所帮助。

我的下一次尝试技术符合您的要求,但它存在最后两个“随机”用户可能相同的风险。

它使用上面相同的group_concat()技巧。但是,通过使用substring_index()

从列表中选择不同的值,它将超出此范围
select u.user_id, user_id.user_rating, u.user_department
from (select (case when n.n in (1, 2, 3) or ud.numusers <= 5
                   then cast(substring_index(substring_index(users, ',', n.n), ',', -1) as unsigned)
                   else CAST(substring_index(substring_index(users, ',', 4 + rand()*(num_users - 3)), ',', -1) as unsigned)
              end) as user_id
      from (select user_department,
                   group_concat(user_id order by user_rating desc) as users,
                   count(*) as numusers
            from t
            group by user_department
           ) ud join
           (select 1 as n union all select 2 union all select 3 union all select 4 union all select 5
           ) n
           on n.n <= ud.numusers
    ) u join
    t
    on u.user_id = t.user_id
order by user_department, user_rating desc