在sqlalchemy

时间:2016-03-12 22:21:56

标签: postgresql sqlalchemy subquery

这是我的问题(非常简化的版本)。

我正在使用Postgresql作为后端并尝试构建sqlalchemy查询 来自另一个查询。

表格设置

以下是包含该示例的一些随机数据的表格。 您可以假设每个表都以声明方式在sqlalchemy中声明 映射器的名称分别为Item和ItemVersion。 在问题的最后,您可以找到我放置代码的链接 这个问题中的所有内容,包括表格定义。

一些项目。

item
+----+
| id |
+----+
|  1 |
|  2 |
|  3 |
+----+

包含每个项目版本的表格。每个人至少有一个。

item_version
+----+---------+---------+-----------+
| id | item_id | version | text      |
+----+---------+---------+-----------+
|  1 |       1 |       0 | item_1_v0 |
|  2 |       1 |       1 | item_1_v1 |
|  3 |       2 |       0 | item_2_v0 |
|  4 |       3 |       0 | item_3_v0 |
+----+---------+---------+-----------+

查询

现在,对于Item上的给定sqlalchemy查询,我想要一个返回的函数 另一个查询,但这次超过(Item, ItemVersion) Item 与原始查询中的相同(并以相同的顺序!),以及 ItemVersion是每个Item的相应最新版本。

以下是SQL中的一个示例,非常简单:

首先对item

进行随机查询
SELECT item.id as item_id
FROM item
WHERE item.id != 2
ORDER BY item.id DESC

对应

+---------+
| item_id |
+---------+
|       3 |
|       1 |
+---------+

然后从该查询中,如果我想加入正确的version,我可以

SELECT sq2.item_id AS item_id,
       sq2.item_version_id AS item_version_id,
       sq2.item_version_text AS item_version_text
FROM (
    SELECT DISTINCT ON (sq.item_id)
           sq.item_id AS item_id,
           iv.id AS item_version_id,
           iv.text AS item_version_text
    FROM (
        SELECT item.id AS item_id
        FROM item
        WHERE id != 2
        ORDER BY id DESC) AS sq
    JOIN item_version AS iv
      ON iv.item_id = sq.item_id
    ORDER BY sq.item_id, iv.version DESC) AS sq2
ORDER BY sq2.item_id DESC

Note that it has to be wrapped in a subquery a second time because the DISTINCT ON discards the ordering.

现在的挑战是编写一个在sqlalchemy中执行此操作的函数。 这是我到目前为止所拥有的。

首先对项目进行初始sqlalchemy查询:

session.query(Item).filter(Item.id != 2).order_by(desc(Item.id))

然后我可以构建我的第二个查询,但没有原始排序。在 换句话说我不知道​​怎么做我做过的第二个子查询包装 SQL返回DISTINCT ON丢弃的排序。

def join_version(session, query):
    sq = aliased(Item, query.subquery('sq'))

    sq2 = session.query(sq, ItemVersion) \
        .distinct(sq.id) \
        .join(ItemVersion) \
        .order_by(sq.id, desc(ItemVersion.version))
    return sq2

我认为this SO question可能是答案的一部分,但我并不完全 确定如何。

运行此问题中所有内容的代码(数据库创建,人口和数据) 到目前为止我所做的失败的单元测试)can be found here。一般 如果你可以修复join_version函数,它应该让测试通过!

1 个答案:

答案 0 :(得分:0)

好的,我找到了办法。它有点像黑客,但仍然只查询数据库两次,所以我想我会活下来!基本上我首先查询Item的数据库,然后我对ItemVersion进行另一次查询,过滤item_id,然后reordering with a trick I found herethis is also relevant)。

以下是代码:

def join_version(session, query):                                  
    items = query.all()                                            
    item_ids = [i.id for i in items]                               
    items_v_sq = session.query(ItemVersion) \                      
        .distinct(ItemVersion.item_id) \                           
        .filter(ItemVersion.item_id.in_(item_ids)) \               
        .order_by(ItemVersion.item_id, desc(ItemVersion.version)) \
        .subquery('sq')                                            
    sq = aliased(ItemVersion, items_v_sq)                          
    items_v = session.query(sq) \                                  
        .order_by('idx(array{}, sq.item_id)'.format(item_ids))     

    return zip(items, items_v)