对于一个项目,我需要跟踪大量的变量。它需要被记录,哪个用户更改哪个变量等。该表看起来(简化为一个变量类型),这样(id是一个表示版本条目的surogate键):
id | variable_id | change_time | change_user | change_task | revision | value
1 1 some date 1 123 1 Hello World
2 2 some date 1 123 1 22.5
3 1 some date 2 456 2 Foo Bar
要检索最新的修订版本(此处为条目2和3),我使用此处描述的解决方案: Retrieving the last record in each group
生成的查询如下所示:
SELECT
v1.id,
v1.value
FROM
variable_history AS v1
LEFT JOIN
variable_hisotry AS v2
ON
(
v1.variable_id = v2.variable_id AND
v1.revision < v2.revision
)
WHERE
v2.id IS NULL
现在我需要修改该查询,以便适用以下规则:
棘手的是,并非每个任务都在不断更改(更新)所有变量,因此我无法对任务X的所有变量进行简单查询。相反,我必须为任务X获取变量,如果有任何,但对于所有其他变量,来自任何任务&lt; X BUT具有最高版本。 (并排除后续任务的修订)
对于任何情况,结果应包含所有变量。所以在这个小例子中,它总是应该有2行。
编辑:
查询
SELECT
v1.id,
v1.value
FROM
(SELECT * FROM variable_history WHERE change_task <= 123) AS v1
LEFT JOIN
(SELECT * FROM variable_history WHERE change_task <= 123) AS v2
ON
(
v1.variable_id = v2.variable_id AND
v1.revision < v2.revision
)
WHERE
v2.id IS NULL
按预期工作。但是每天大约有10,000个玩家,我对双子选择后来加入不满意...
http://sqlfiddle.com/#!2/cfda03/2
编辑:嗯,另一方面:variable_history的每一行也绑定到entity_id和ofc。将2个子选择限制为一个有问题的实体会将表格大小减小到......像150个不同的变量......所以不应该是一个性能问题。
答案 0 :(得分:1)
SELECT v.*
FROM (
SELECT variable_id, MAX(revision) revision
FROM variable_history
GROUP BY variable_id
) very_latest LEFT JOIN (
SELECT variable_id, MAX(revision) revision
FROM variable_history
WHERE change_task = ?
GROUP BY variable_id
) task_latest USING (variable_id)
JOIN variable_history v
ON v.variable_id = very_latest.variable_id
AND v.revision = COALESCE(task_latest.revision, very_latest.revision)