SQLAlchemy - WHERE子句中的子查询

时间:2011-06-01 19:30:43

标签: python sqlalchemy subquery

我刚刚开始使用SQLAlchemy,但仍然无法解决一些概念。

归结为基本元素,我有两个这样的表(这是通过Flask-SQLAlchemy):

class User(db.Model):
    __tablename__ = 'users'
    user_id = db.Column(db.Integer, primary_key=True)

class Posts(db.Model):
    __tablename__ = 'posts'
    post_id = db.Column(db.Integer, primary_key=True)
    user_id = db.Column(db.Integer, db.ForeignKey('users.user_id'))
    post_time = db.Column(db.DateTime)

    user = db.relationship('User', backref='posts')

如何查询用户列表及其最新帖子(不包括没有帖子的用户)。如果我使用SQL,我会这样做:

SELECT [whatever]
FROM posts AS p
    LEFT JOIN users AS u ON u.user_id = p.user_id
WHERE p.post_time = (SELECT MAX(post_time) FROM posts WHERE user_id = u.user_id)

所以我确切地知道“想要的”SQL以获得我想要的效果,但不知道如何在SQLAlchemy中“正确”地表达它。

编辑:如果它很重要,我就在SQLAlchemy 0.6.6上。

3 个答案:

答案 0 :(得分:60)

上一个答案有效,但你要求的确切sql也写得与实际声明一样:

print s.query(User, Posts).\
    outerjoin(Posts.user).\
    filter(Posts.post_time==\
        s.query(
            func.max(Posts.post_time)
        ).
        filter(Posts.user_id==User.user_id).
        correlate(User).
        as_scalar()
    )

我认为不一定明显的“概念”是as_scalar()当前需要将子查询建立为“标量”(它应该假设从上下文中反对==)。

编辑:确认,这是错误行为,已完成票证#2190。在当前的提示或版本0.7.2中,自动调用as_scalar(),上述查询可以是:

print s.query(User, Posts).\
    outerjoin(Posts.user).\
    filter(Posts.post_time==\
        s.query(
            func.max(Posts.post_time)
        ).
        filter(Posts.user_id==User.user_id).
        correlate(User)
    )

答案 1 :(得分:51)

这应该有效(不同的SQL,相同的结果):

t = Session.query(
    Posts.user_id,
    func.max(Posts.post_time).label('max_post_time'),
).group_by(Posts.user_id).subquery('t')

query = Session.query(User, Posts).filter(and_(
    User.user_id == Posts.user_id,
    User.user_id == t.c.user_id,
    Posts.post_time == t.c.max_post_time,
))

for user, post in query:
    print user.user_id, post.post_id
  

其中c代表'columns'

答案 2 :(得分:0)

通常,它的表达方式与实际SQL相似-创建一个返回单个结果并与之比较的子查询-但是,有时 真正的痛苦 是必须在子查询中使用已经查询或加入的表。

解决方案是创建模型的别名版本以在子查询中引用。

因此,假设您已经在现有Posts model和一些基本query就绪的连接中进行操作-现在,您想查询以下列表:每个用户的最新(单个)帖子,您可以使用以下方式过滤查询:

from sqlalchemy.orm import aliased
posts2 = aliased(Posts) # create aliased version

query = query.filter(
    model.post_id
    ==
    Posts.query # create query directly from model, NOT from the aliased version!
        .with_entities(posts2.post_id) # only select column "post_id"
        .filter(
            posts2.user_id == model.user_id
        )
        .order_by(posts2.post_id.desc()) # assume higher id == newer post
        .limit(1) # we must limit to a single row so we only get 1 value
)

我故意不使用func.max,因为我认为这是一个更简单的版本,并且已经在其他答案中使用,我认为该示例对于通常会发现此问题的人很有用,因为他们正在寻找一个解决方案如何对同一张表进行子查询。