应用错误收集

下面的impala查询运行速度非常慢。

SELECT pattern, MAX(time) 
  FROM (SELECT t.time, p.pattern 
          FROM t 
          JOIN p 
            ON (t.name LIKE p.pattern)) AS tmp 
 GROUP BY pattern

p 有10亿条记录，而 t 只有1条记录。

如何优化此功能？这实际上是一个嵌套的循环连接，但为什么这需要大约半个小时才能完成？

当我使用以下查询

时，还有什么

SELECT time 
  FROM p 
 WHERE name LIKE 'one_pattern' 
 ORDER BY time DESC LIMIT 1

只需3秒。我真的很困惑。

一张小桌子就像使用黑斑羚一样加入大桌子

0 个答案: