我有一个使用ORDER BY RAND()
的查询但是它需要的时间太长而且随着数据的增长而越来越差。
查询连接两个表,它返回5个随机产品和每个产品的随机图像
product_id - pk auto-inc
name
description
1 - product 1 - description
2 - product 2 - description
image_id - pk auto-inc
product_id - fk index
filename
1 - 1 - product 1 image
2 - 1 - product 1 image
3 - 1 - product 1 image
4 - 2 - product 2 image
...
答案 0 :(得分:5)
ORDER BY RAND()
很慢,因为DBMS必须读取所有行,对它们进行排序,只保留几行。因此,此查询的性能在很大程度上取决于表中的行数,并随着行数的增加而减少。
没有办法优化它。
但是有其他选择:
您可以通过执行6次查询来实现“获取5个随机行”:
使用OFFSET <random offset from 0 to $number_of_rows-1> LIMIT 1
进行5次查询(即从某个随机偏移量中只读取并返回一行)
例如:SELECT * FROM Products OFFSET 42 LIMIT 1
(注意:暂时没有加入)
此类查询非常快,并且在几乎与表格大小无关的时间内运行。
这应该 比ORDER BY RAND()
更快。
现在,为每个随机产品获取一个随机图像:
SELECT *
FROM (
SELECT *
FROM Products
OFFSET 42 LIMIT 1
) p
JOIN ProductImages pi
ON pi.product_id = p.id
ORDER BY RAND()
LIMIT 1
内部查询仍然很快,外部只排序几行(假设每个产品的图像很少),因此仍然可以使用rand()的顺序。