POSTGRES-子查询返回结果非常慢

时间:2019-12-11 08:26:52

标签: sql postgresql subquery

我有一个非常简单的查询,但是它包含一个子查询。 我想获取resource_id的列表,这些列表以ORDER BY DESC;的顺序通过过滤器。

更多信息 基本上,我们需要找到通过以下查询中提到的过滤器的resource_id's列表

   SELECT rs.resource_id
FROM resource rs
WHERE (
    SELECT rc.resource_id
    FROM risk_child rc
    WHERE rc.resource_id = rs.resource_id 
    AND rc.cloudaccount_id = rs.cloud_account_id
    AND rs.reg_id= any(array[236]) 
    AND rc.risk_level= any(array['high','low'])
    AND rc.status = any(array['fail'])
    AND rc.cloudaccount_id= any (array['4ZiCmwslbjhmRtHAOjLG'])
    ORDER BY rc.id DESC
    LIMIT 1
) = rs.resource_id

这些资源随后将传递到此处提到的另一个查询中:

SELECT
  DISTINCT ON (rc.resource_id, rc.rule_id, s.id) MAX(rc.creationtime) as creationtime,
  rc.resource_id,
  rl.rule_tag,
  s.service,
  r.region,
  rc.status,
  rs.vpc_id,
  rc.cloudaccount_id,
  rc.organization_id,
  rs.owner_id,
  rc.description,
  f.function_name,
  g.group_name,
  rc.risk_level,
  rc.id,
  rc.user_id,
  rc.pro_id,
  c.category_name,
  rc.raw as rawResponse,
  rs.res_ca_id,
  rs.resource_name
FROM
  risk_child rc,
  resource rs,
  rule rl,
  service s,
  region r,
  function f,
  g_by g,
  category c
WHERE
  rc.resource_id = rs.resource_id
  AND rl.id = rc.rule_id
  AND s.id = rs.ser_id
  AND rs.reg_id = r.id
  AND f.id = rc.function_id
  AND c.id = rc.category_id
  AND g.id = rc.group_id
  AND rc.cloudaccount_id like any (array $ { modifiedCloudAccounts })
  AND rc.organization_id = $ { orgId }
  AND rc.rule_id > 0
  AND rc.cloudaccount_id = rs.cloud_account_id
  AND rs.resource_id like any (array $ { getResources }) $ { risk }
GROUP BY
  rc.rule_id,
  rc.creationtime,
  rc.creationtime,
  rc.resource_id,
  rl.rule_tag,
  rl.id,
  s.service,
  r.region,
  rc.status,
  rs.vpc_id,
  rc.cloudaccount_id,
  rc.organization_id,
  rs.owner_id,
  rc.description,
  f.function_name,
  g.group_name,
  rc.risk_level,
  rc.id,
  rc.user_id,
  rc.pro_id,
  c.category_name,
  rc.raw,
  s.id,
  rs.res_ca_id
ORDER BY
  rc.resource_id,
  rc.rule_id ASC;

问题 现在,第一个查询返回的结果非常慢,即使在建立索引后5到6秒也是如此。因此请记住,第一个查询需要运行两次

  1. 一个用于获取总行数(用于分页)
  2. 第二次获取resource_ids

我主要在应用程序中使用NO-SQL,因此我对SQL查询还是相当陌生的。任何帮助,将不胜感激。 谢谢

1 个答案:

答案 0 :(得分:0)

所以最终这件事对我的情况有用:

    SELECT rs.resource_id
FROM resource rs
WHERE EXISTS (SELECT *
              FROM risk_child rc
              WHERE rc.resource_id = rs.resource_id 
                AND rc.cloudaccount_id = rs.cloud_account_id
                AND rs.reg_id= any(array[236]) 
                AND rc.risk_level= any(array['high','low'])
                AND rc.status = any(array['fail'])
                AND rc.cloudaccount_id= any (array['4ZiCmwslbjhmRtHAOjLG'])
             )

基本上,正如我在帖子中所解释的那样,我对SQL还是很陌生,我没有在表中放置适当的索引,因此我必须添加以下索引以加快查询速度

resource(resource_id, cloud_account_id)risk_child(resource_id, cloudaccount_id)有助于我进一步提高自己的表现。