我正在尝试将相当短的SQL转换为sqlAlchemy ORM查询。 SQL使用Postgres的generate_series
来创建一组日期,而我的目标是创建一组按列之一分类的时间序列数组。
表(简体)非常简单:
counts:
-----------------
count (Integer)
day (Date)
placeID (foreign key related to places)
"counts_pkey" PRIMARY KEY (day, placeID)
places:
-----------------
id
name (varchar)
我需要的输出是每个地方的时间序列,其中包括当一天未报告计数时的空值。例如,这对应于四天的系列:
array_agg | name
-----------------+-------------------
{NULL,0,7,NULL} | A Place
{NULL,1,NULL,2} | Some other place
{5,NULL,3,NULL} | Yet another
我可以很容易地做到这一点,方法是在日期范围和地点上放置一个CROSS JOIN
并将其与计数相结合:
SELECT array_agg(counts.count), places.name
FROM generate_series('2018-11-01', '2018-11-04', interval '1 days') as day
CROSS JOIN places
LEFT OUTER JOIN counts on counts.day = day.day AND counts.PlaceID = places.id
GROUP BY places.name;
我似乎无法弄清楚的是如何使SQLAlchemy做到这一点。经过大量的挖掘,我发现一个old google groups thread几乎可以解决这个问题:
date_list = select([column('generate_series')])\
.select_from(func.generate_series(backthen, today, '1 day'))\
.alias('date_list')
time_series = db.session.query(Place.name, func.array_agg(Count.count))\
.select_from(date_list)\
.outerjoin(Count, (Count.day == date_list.c.generate_series) & (Count.placeID == Place.id ))\
.group_by(Place.name)
这会为时间序列创建子选择,但会产生数据库错误:
有一个用于表“ places”的条目,但是不能在查询的这一部分中引用它。
所以我的问题是:您将如何在sqlalchemy中做到这一点。另外,我很容易接受这样的想法,因为我使用SQL的方法是头脑僵硬的。
答案 0 :(得分:1)
问题在于,给定查询构造SQLAlchemy会按照以下方式生成查询
SELECT ...
FROM places,
(...) AS date_list LEFT OUTER JOIN count ON ... AND count."placeID" = places.id
...
有2个FROM
列表项:places
和联接。项不能互相交叉引用 1 ,因此,places.id
子句中由于ON
导致的错误。
SQLAlchemy不支持显式CROSS JOIN
,但是另一方面,CROSS JOIN
等效于INNER JOIN ON (TRUE)
。您也可以省略将函数表达式包装在子查询中,并按giving it an alias的原样使用它:
date_list = func.generate_series(backthen, today, '1 day').alias('gen_day')
time_series = session.query(Place.name, func.array_agg(Count.count))\
.join(date_list, true())\
.outerjoin(Count, (Count.day == column('gen_day')) &
(Count.placeID == Place.id ))\
.group_by(Place.name)
1 :除了函数调用FROM
项或使用LATERAL
的项。