从每个组获取特定行

时间:2019-06-26 23:35:24

标签: sql sql-server tsql

我的问题与this非常相似,除了我希望能够根据某些条件进行过滤。

我有一个表“ DOCUMENT”,看起来像这样:

|ID|CONFIG_ID|STATE     |MAJOR_REV|MODIFIED_ON|ELEMENT_ID|
+--+---------+----------+---------+-----------+----------+
| 1|1234     |Published | 2       |2019-04-03 | 98762    |
| 2|1234     |Draft     | 1       |2019-01-02 | 98762    |
| 3|5678     |Draft     | 3       |2019-01-02 | 24244    |
| 4|5678     |Published | 2       |2017-10-04 | 24244    |
| 5|5678     |Draft     | 1       |2015-05-04 | 24244    |

实际上还有其他几列,但我试图将其保持简单。

对于每个CONFIG_ID,我想选择最新的(MAX(MAJOR_REV)或MAX(MODIFIED_ON))-但我可能想按其他条件(例如状态(例如,文档的最新发布修订版))进行过滤和/或日期(截至特定日期的最新修订版本,是否已发布;或:在特定日期间隔内发布/修改的所有文档)。

为了使事情变得更加有趣,我还想加入其他一些表。

这是我到目前为止所拥有的:

SELECT

        allDocs.ID,
        d.CONFIG_ID,
        d.[STATE],
        d.MAJOR_REV,
        d.MODIFIED_ON,
        d.ELEMENT_ID,
        f.ID FILE_ID,
        f.[FILENAME],
        et.COLUMN1,
        e.COLUMN2

FROM DOCUMENT -- Get all document revisions

CROSS APPLY (       -- Then for each config ID, only look at the latest revision
    SELECT TOP 1
        ID,
        MODIFIED_ON,
        CONFIG_ID,
        MAJOR_REV,
        ELEMENT_ID,
        [STATE]
    FROM DOCUMENT
    WHERE CONFIG_ID=allDocs.CONFIG_ID
    ORDER BY MAJOR_REV desc
) as d

LEFT OUTER JOIN ELEMENT e ON e.ID = d.ELEMENT_ID
LEFT OUTER JOIN ELEMENT_TYPE et ON e.ELEMENT_TYPE_ID=et.ID
LEFT OUTER JOIN TREE t ON t.NODE_ID = d.ELEMENT_ID

OUTER APPLY (   -- This is another optional 1:1 relation, but it's wrongfully implemented as m:n
        SELECT TOP 1
            FILE_ID
        FROM DOCUMENT_FILE_RELATION
        WHERE DOCUMENT_ID=d.ID
        ORDER BY MODIFIED_ON DESC
        ) as df -- There should never be more than 1, but we're using TOP 1 just in case, to avoid duplicates

LEFT OUTER JOIN [FILE] f on f.ID=df.FILE_ID

WHERE
    allDocs.CONFIG_ID = '5678' -- Just for testing purposes
    and d.state ='Released'  -- One possible filter criterion, there may be others

结果似乎正确,但是返回了多个相同的行。 我的猜测是,对于具有4个修订版的文档,相同的值会被发现4次并返回。

一个简单的SELECT DISTINCT可以解决这个问题,但是我更喜欢修复查询。

1 个答案:

答案 0 :(得分:0)

我认为这将是经典的row_number和分区。

;with rows as
(
    select <your-columns>,
       row_number() over (partion by config_id order by <whatever you want>) as rn
    from document
    join <anything else>
    where <whatever>
 )
 select * from rows where rn=1