DB2 UNION ALL 降低了查询的性能

时间:2021-07-15 09:43:00

标签: sql db2 query-optimization database-performance

我正在运行类似于下面的查询。

Query 1
UNION ALL
Query 2

单独查询 1 需要大约 20 秒并返回大约 1000 行。 仅查询 2 需要大约 20 秒并返回大约 4000 行。 但是使用 UNION ALL 运行时,需要 10 多分钟。

我不认为 UNION ALL 会很昂贵,因为它甚至不需要删除重复项,只需合并结果即可。

当我查看访问计划时,对于整个查询与仅查询 1/2,当单独运行与在 UNION ALL 中运行时,会为查询 1/2 生成相同的访问计划。

成本看起来没有什么异常,但是我看到查询 1 和查询 2 的“估计行数”与实数相差甚远。它显示每个查询超过 60,000,000,其中您可以看到查询 1 只返回 1000,2 返回 4000。这会导致 UNION ALL 性能不佳吗?

有一个有趣的更新 - 这两个查询都可以正常工作,看起来类似于下面

SELECT col1, CASE WHEN col2=1 THEN 'A' ELSE 'B' END, SUM(col3)
FROM Table1
GROUP BY col1, 
         col2, /*This was not part of original query, I added it in order to be able to remove line below*/
        CASE WHEN col2=1 THEN 'A' ELSE 'B' END

如果我在两个查询中从 GROUP BY 中删除 'CASE WHEN col2=1 THEN 'A' ELSE 'B' END',它们的性能开始与 UNION ALL 查询一样差。同样,在 group by 中比较有和没有 CASE 的访问计划似乎没有什么问题。

1 个答案:

答案 0 :(得分:0)

我的猜测是每个结果集(6000 万条记录)的大小足够大,以至于可能无法一次性将完整联合存储在内存中。如果是这样,那么 DB2 将被迫将一部分结果集分页到磁盘。磁盘读取和写入可能比在内存中执行相同操作慢几个数量级。