下面的impala查询运行速度非常慢。
SELECT pattern, MAX(time)
FROM (SELECT t.time, p.pattern
FROM t
JOIN p
ON (t.name LIKE p.pattern)) AS tmp
GROUP BY pattern
p 有10亿条记录,而 t 只有1条记录。
如何优化此功能?这实际上是一个嵌套的循环连接,但为什么这需要大约半个小时才能完成?
当我使用以下查询
时,还有什么SELECT time
FROM p
WHERE name LIKE 'one_pattern'
ORDER BY time DESC LIMIT 1
只需3秒。我真的很困惑。