使用SQLAlchemy

时间:2018-07-25 20:21:32

标签: python mysql orm sqlalchemy

如果问题标题没有描述性/措辞不当,表示歉意。

我希望能够计算出满足特定条件的行中有多少个特定值的实例。考虑以下两个表queuesqueue_contents

队列表:

+----+---------+
| id |  name   |
+----+---------+
|  1 | queue A |
|  2 | queue B |
|  3 | queue C |
+----+---------+

queue_contents表:

+-----+----------+--------+
| id  | queue_id | foo_id |
+-----+----------+--------+
|  1  |        1 |    10  |
|  2  |        1 |    11  |
|  3  |        1 |    12  |
|  5  |        2 |    20  |
|  6  |        2 |    21  |
|  7  |        2 |    23  |
|  8  |        2 |    24  |
|  9  |        3 |    10  |
|  10 |        3 |    11  |
|  11 |        3 |    20  |
|  12 |        3 |    30  |
+-----+----------+--------+

我希望查询queue_id == 3

时输出以下结果的查询
+----------+------------+-------------+-----------------------+
| queue_id | queue_name | total_count | contained_in_this_one |
+----------+------------+-------------+-----------------------+
|        1 | queue A    |           3 |                     2 |
|        2 | queue B    |           4 |                     1 |
+----------+------------+-------------+-----------------------+

我不知道如何计算foo_id中出现的queue_contents.foo_id WHERE queue_contents.queue_id == 3实例

获取每个队列的total_count很简单,但是在设置子查询和条件时,我很困惑。我认为该解决方案涉及使用子查询并计算该子查询中发生的foo_id的数量,但是我无法使其正常工作。我不会包含我尝试过的以下查询的maaaany迭代,尽管这可以使您大致了解我所处的轨道:

此查询中的

foo_id s

sq = db_session.query(Foo.id.label('foo_id')) \
               .join(QueueContent, QueueContent.foo_id == Foo.id) \
               .filter(QueueContent.queue_id == 3) \
               .subquery('sq')

foo_alias = aliased(Foo)

q2 = db_session.query(func.count(Foo.id).label('total_in_task'),
                      func.count(foo_alias.id).label('count_in_this_task'),
                      Queue.id.label('queue_id'),
                      Queue.name.label('queue_name')) \
             .join(foo_alias, foo_alias.id == Foo.id) \
             .join(QueueContent, QueueContent.foo_id == Foo.id) \
             .join(Queue, Queue.id == QueueContent.queue_id) \
             .filter(Queue.id != 3) \
             .group_by('queue_name', 'queue_id')

1 个答案:

答案 0 :(得分:2)

如果queue_id组不包含foo_id个重复项,则可以使用LEFT JOIN:

qc2 = aliased(QueueContent)

session.query(QueueContent.queue_id,
              func.count(),
              func.count(qc2.foo_id)).\
    outerjoin(qc2, and_(qc2.queue_id == 3,
                        qc2.foo_id == QueueContent.foo_id)).\
    filter(QueueContent.queue_id != 3).\
    group_by(QueueContent.queue_id)

如果这样做,则可以使用包裹在NULLIF中的EXISTS子查询表达式(或强制转换为整数和求和):

qc2 = aliased(QueueContent)

sq = session.query(qc2).\
    filter_by(queue_id=3, foo_id=QueueContent.foo_id).\
    exists()

session.query(QueueContent.queue_id,
              func.count(),
              func.count(func.nullif(sq, False))).\
    filter(QueueContent.queue_id != 3).\
    group_by(QueueContent.queue_id)

两个变体都使用COUNT( expression )产生 expression 的值不为NULL的行数的事实。