我正在尝试编写一些Oracle 11g SQL,但我遇到了一些鸡蛋和鸡蛋问题。我正在寻找类似电子表格的行为。我找到了一个使用Oracle MODEL
子句的解决方案,但性能不是很好。所以我想知道“非MODEL
”解决方案在技术上是否可行。
这是一个玩具示例,展示了我正在尝试做的事情。鉴于此表:
CREATE TABLE t (id NUMBER PRIMARY KEY, n NUMBER);
INSERT INTO t (id, n) VALUES (2, 0);
INSERT INTO t (id, n) VALUES (3, 1);
INSERT INTO t (id, n) VALUES (5, 1);
INSERT INTO t (id, n) VALUES (7, 2);
INSERT INTO t (id, n) VALUES (11, 3);
INSERT INTO t (id, n) VALUES (13, 5);
INSERT INTO t (id, n) VALUES (17, 8);
INSERT INTO t (id, n) VALUES (19, 13);
我想计算另外两个派生列,称之为X
和Y
。
以下是有关如何计算X
和Y
的规则:
X: 对于第一行,由ID的最小值定义,将
X
设置为N
。 对于所有后续行,X
的值应比前一个Y
的值小1,按ID
排序。Y: 两次
N
加上X
。
接下来的几个步骤显示了如果我要手动执行此操作,我将如何填写所需的视图。首先,给定数据的前几行:
ID N X Y
--- --- --- ---
2 0
3 1
5 1
7 2
....
由于我们位于第一行,X
应设置为N
或0
。 Y
应为2 * N + X
或0
。
ID N X Y
--- --- --- ---
2 0 0 0
3 1
5 1
7 2
....
现在,由于我们不再是第一行,X
应始终比上一行的Y
少一个。在第二行中,这意味着X
=(上一个Y
) - 1
= 0 - 1
= -1
。第二行的Y
将为2 * N + X
,或2 * (1) + (-1)
= 1
。
ID N X Y
--- --- --- ---
2 0 0 0
3 1 -1 1
5 1
7 2
....
如果继续数学,这是理想的结果:
ID N X Y
--- --- --- ---
2 0 0 0
3 1 -1 1
5 1 0 2
7 2 1 5
11 3 4 10
13 5 9 19
17 8 18 34
19 13 33 59
考虑到如何计算X
和Y
的规则,是否可以在不必诉诸MODEL
子句的情况下获得此结果?
我不是在寻找基于这个特定例子的数学简化;这只是我想出的一个玩具示例,它展示了我在实际问题中所面临的那种相互依赖。
P.S。:这是一个MODEL
例子我能够拼凑起来产生这个输出;也许有可能改进性能的修改?
SQL> WITH u AS (
2 SELECT ROW_NUMBER() OVER (ORDER BY t.id) r
3 , t.id
4 , t.n
5 FROM t
6 )
7 SELECT r
8 , id
9 , n
10 , x
11 , y
12 FROM u
13 MODEL
14 DIMENSION BY (r)
15 MEASURES (id
16 , n
17 , CAST(NULL AS NUMBER) x
18 , CAST(NULL AS NUMBER) y) RULES AUTOMATIC ORDER
19 ( x[1] = n[cv()]
20 , y[r] = 2 * n[cv()] + x[cv()]
21 , x[r > 1] ORDER BY r = y[cv() - 1] - 1
22 )
23 ;
R ID N X Y
---------- ---------- ---------- ---------- ----------
1 2 0 0 0
2 3 1 -1 1
3 5 1 0 2
4 7 2 1 5
5 11 3 4 10
6 13 5 9 19
7 17 8 18 34
8 19 13 33 59
8 rows selected.
SQL>
感谢。
答案 0 :(得分:2)
您可以使用recursive subquery factoring(也称为递归CTE):
with tmp as (
select t.*,
row_number() over (order by t.id) as rn
from t
),
r (id, n, x, y, rn) as (
select id, n, 0, 0, rn
from tmp
where rn = 1
union all
select tmp.id, tmp.n, r.y - 1, (tmp.n * 2) + r.y - 1, tmp.rn
from r
join tmp on tmp.rn = r.rn + 1
)
select id, n, x, y
from r
order by rn;
ID N X Y
---------- ---------- ---------- ----------
2 0 0 0
3 1 -1 1
5 1 0 2
7 2 1 5
11 3 4 10
13 5 9 19
17 8 18 34
19 13 33 59
它基本上是通过您的手动步骤。锚定成员是您的第一个手动步骤,将x
和y
设置为第一行的零。然后递归成员执行您指定的计算。 (在计算该行的x
时,您无法引用新计算的y
值,因此您必须将其重复为(tmp.n * 2) + r.y - 1
)。 rn
只是按ID保留行顺序,同时更容易找到下一行 - 这样您就可以查找rn + 1
而不是直接找到下一个最高ID值。
与您的示例数据没有显着的性能差异,但是添加了一千行,模型子句大约需要5秒,递归CTE大约需要1秒;另外千行模型需要~20秒,CTE需要~3秒;用另一千行模型耗时约40秒,CTE耗时约6秒;另外一千行(总共4,008行)模型耗时约75秒,CTE耗时约10秒。 (我厌倦了等待比这更多行的模型版本;在用10,000分钟后杀死它5分钟)。我真的不能说这将如何与你的真实数据一起表现,但在此基础上,它可能值得尝试。