PostgreSQL,从2个表中选择,但只从表2中选择最新元素

时间:2009-11-09 20:19:53

标签: sql postgresql

嘿,我在PostgreSql中有2个表:

1 - documents: id, title
2 - updates: id, document_id, date

和一些数据:

文件:

| 1 | Test Title |

更新

| 1 | 1 | 2006-01-01 |
| 2 | 1 | 2007-01-01 |
| 3 | 1 | 2008-01-01 |

所以所有更新都指向同一个文档,但所有更新都有不同的更新日期。

我要做的是从文档表中进行选择,但也包括基于日期的最新更新。

这样的查询怎么样?这是我现在拥有的那个,但我列出了所有更新,而不是我需要的最新更新:

SELECT * FROM documents,updates WHERE documents.id=1 AND documents.id=updates.document_id ORDER BY date

包括;我在查询中需要这个的原因是我想按更新模板的日期排序!

  

编辑:这个脚本很重要   简化,所以我应该能够   创建一个返回任何数字的查询   结果,但包括最新的   更新日期。我在考虑使用   内连接或左连接或其他东西   那样的!?

5 个答案:

答案 0 :(得分:19)

使用PostgreSQL分机DISTINCT ON

SELECT  DISTINCT ON (documents.id) *
FROM    document
JOIN    updates
ON      updates.document_id = document_id
ORDER BY
        documents.id, updates.date DESC

这将按document.id顺序从每个ORDER BY群集中获取第一行。

要检查的测试脚本:

SELECT  DISTINCT ON (documents.id) *
FROM    (
        VALUES
        (1, 'Test Title'),
        (2, 'Test Title 2')
        ) documents (id, title)
JOIN    (
        VALUES
        (1, 1, '2006-01-01'::DATE),
        (2, 1, '2007-01-01'::DATE),
        (3, 1, '2008-01-01'::DATE),
        (4, 2, '2009-01-01'::DATE),
        (5, 2, '2010-01-01'::DATE)
        ) updates (id, document_id, date)
ON      updates.document_id = documents.id
ORDER BY
        documents.id, updates.date DESC

答案 1 :(得分:8)

您可以创建一个派生表,其中只包含每个document_id的最新“更新”记录,然后加入“文档”:

SELECT d.id, d.title, u.update_id, u."date"
FROM documents d
LEFT JOIN
-- JOIN "documents" against the most recent update per document_id
(
SELECT recent.document_id, id AS update_id, recent."date"
FROM updates
INNER JOIN
(SELECT document_id, MAX("date") AS "date" FROM updates GROUP BY 1) recent
ON updates.document_id = recent.document_id
WHERE
  updates."date" = recent."date"
) u
ON d.id = u.document_id;

这将处理“未更新”的文档,如下所示:

pg=> select * from documents;
 id | title 
----+-------
  1 | foo
  2 | bar
  3 | baz
(3 rows)

pg=> select * from updates;
 id | document_id |    date    
----+-------------+------------
  1 |           1 | 2009-10-30
  2 |           1 | 2009-11-04
  3 |           1 | 2009-11-07
  4 |           2 | 2009-11-09
(4 rows)

pg=> SELECT d.id ...
 id | title | update_id |    date    
----+-------+-----------+------------
  1 | foo   |         3 | 2009-11-07
  2 | bar   |         4 | 2009-11-09
  3 | baz   |           | 
(3 rows)

答案 2 :(得分:4)

select *
from documents
left join updates
  on updates.document_id=documents.id
  and updates.date=(select max(date) from updates where document_id=documents.id)
where documents.id=?;

它比以前的答案有一些优势:

  • 你只能在一个方便的地方写文件_id;
  • 您可以省略在哪里,您将获得所有文档及其最新更新的表格;
  • 您可以使用更广泛的选择条件,例如where documents.id in (1,2,3)

您也可以使用group by避免使用subselect,但是您必须在group by子句中列出所有文档字段:

select documents.*, max(date) as max_date
  from documents
  left join updates on documents.id=document_id
  where documents.id=1
  group by documents.id, title;

答案 3 :(得分:2)

从头到尾:

ORDER BY date DESC LIMIT 1

如果你真的只想要id 1你可以使用这个查询:

SELECT * FROM documents,updates 
    WHERE documents.id=1 AND updates.document_id=1 
    ORDER BY date DESC LIMIT 1

http://www.postgresql.org/docs/8.4/interactive/queries-limit.html

答案 4 :(得分:-1)

这也应该有用

SELECT * FROM documents, updates 
    WHERE documents.id=1 AND updates.document_id=1
    AND updates.date = (SELECT MAX (date) From updates)