选择SQL中的自连接中的第一个子记录

时间:2012-02-24 11:17:43

标签: tsql join subquery

我有一个visits表,如下所示:

id identity(1,1) not null,
visit_date datetime not null,
patient_id int not null,
flag bit not null

对于每条记录,我需要找到同一时间或更早的匹配记录,具有相同的patient_id,并且flag设置为1.我现在正在做的是:

select parent.id as parent_id, 
(
   select top 1 
      child.id as child_id
   from 
      visits as child
   where 
     child.visit_date <= parent.visit_date
     and child.patient_id = parent.patient_id
     and child.flag = 1
   order by 
     visit_date desc
 ) as child_id
from 
   visits as parent

所以,这个查询正常工作,除了它运行得太慢 - 我怀疑这是因为子查询。是否可以将其重写为连接查询?

2 个答案:

答案 0 :(得分:1)

查看查询执行计划。如果你有粗箭头,请看那些陈述。您应该了解不同的陈述及其含义,例如Clustered Index Scan / Seek等。

通常当查询进展缓慢时,我发现没有好的索引。

受影响和用于加入的表和列创建一个涵盖所有这些列的索引。这通常在论坛中称为覆盖索引。这是你可以为真正需要的东西做的事情。但请记住,过多的索引会降低插入语句的速度。

答案 1 :(得分:0)

   /* 
    id identity(1,1) not null,
    visit_date datetime not null,
    patient_id int not null,
    flag bit not null
   */

SELECT
    T.parentId,
    T.patientId,
    V.id AS childId
FROM
    (
    SELECT
        visit.id AS parentId,
        visit.patient_id AS patientId,
        MAX (previous_visit.visit_date) previousVisitDate
    FROM
        visit
        LEFT JOIN visit previousVisit ON
            visit.patient_id = previousVisit.patient_id
            AND visit.visit_date >= previousVisit.visit_date
            AND visit.id <> previousVisit.id
            AND previousVisit.flag = 1
    GROUP BY
        visit.id,
        visit.visit_date,
        visit.patient_id,
        visit.flag
    ) AS T
    LEFT JOIN visit V ON
      T.patientId = V.patient_id
      AND T.previousVisitDate = V.visit_date