有许多酒店拥有不同的床位。我需要知道,在任何一天,每家酒店都会占用多少张床。
示例数据:
HOTEL CHECK-IN CHECK-OUT
A 29.05.2010 30.05.2010
A 28.05.2010 30.05.2010
A 27.05.2010 29.05.2010
B 18.08.2010 19.08.2010
B 16.08.2010 20.08.2010
B 15.08.2010 17.08.2010
中介结果:
HOTEL DAY OCCUPIED_BEDS
A 27.05.2010 1
A 28.05.2010 2
A 29.05.2010 3
A 30.05.2010 2
B 15.08.2010 1
B 16.08.2010 2
B 17.08.2010 2
B 18.08.2010 2
B 19.08.2010 2
B 20.08.2010 1
最终结果:
HOTEL MAX_OCCUPATION
A 3
B 2
A similar question is asked before.我想在两个日期之间获取日期列表(as Tom Kyte shows),并使用group by
计算每天的容量。问题是我的桌子相对较大,我想知道是否有成本较低的方法来完成这项任务。
答案 0 :(得分:2)
创建一个包含您感兴趣的日子的临时表
create table #dates (dat datetime)
insert into #dates (dat) values ('20121116')
insert into #dates (dat) values ('20121115')
insert into #dates (dat) values ('20121114')
insert into #dates (dat) values ('20121113')
通过将预订与日期相结合来获得中间结果,以便每个预订日一个“生成”
SELECT Hotel, d.dat, COUNT(*) from bookings b
INNER JOIN #dates d on d.dat BETWEEN b.checkin AND b.checkout
GROUP BY Hotel, d.dat
最后得到Max
SELECT Hotel, Max(OCCUPIED_BEDS) FROM IntermediateResult GROUP BY Hotel
答案 1 :(得分:2)
我认为没有比你在问题中概述的方法更好的方法。创建您的日历表(或动态生成一个表)。我个人喜欢躺着,每年更新一次。
理解分析函数的人可能会在没有内部/外部查询的情况下执行此操作,但由于内部分组是外部的子集,因此它没有太大区别。
Select
i.Hotel,
Max(i.OccupiedBeds)
From (
Select
s.Hotel,
d.DayID,
Count(*) As OccupiedBeds
From
SampleData s
Inner Join
Days d
-- might not need to +1 depending on business rules.
-- I wouldn't count occupancy on the day I check out, if so get rid of it
On d.DayID >= s.CheckIn And d.DayID < s.CheckOut + 1
Group By
s.Hotel,
d.DayID
) i
Group By
i.Hotel
经过一段时间的游戏,我无法在没有内部查询的情况下使用分析函数版本:
如果速度确实是一个问题,你可以考虑在主表上维护一个带触发器的中间表。
答案 2 :(得分:1)
性能问题是连接条件不是基于相等性,这使得哈希连接成为不可能。假设我们有一个酒店 - 日酒店日对表,我会尝试这样的事情:
select ch_in.hotel, ch_in.day,
(check_in_cnt - check_out_cnt) as occupancy_change
from ( select d.hotel, d.day, count(s.hotel) as check_in_cnt
from hotel_days d,
sample_data s
where s.hotel(+) = d.hotel
and s.check_in(+) = d.day
group by d.hotel, d.day
) ch_in,
( select d.hotel, d.day, count(s.hotel) as check_out_cnt
from hotel_days d,
sample_data s
where s.hotel(+) = d.hotel
and s.check_out(+) = d.day
group by d.hotel, d.day
) ch_out
where ch_out.hotel = ch_in.hotel
and ch_out.day = ch_in.day
权衡是双重全扫描,但我认为它仍然会运行得更快,并且可以并行化。 (我假设sample_data很大,主要是由于预订的数量,而不是酒店本身的数量。)输出是特定日期特定酒店的入住率变化,但这可以很容易地总结为总价值与任何分析函数或(可能更有效)使用批量收集的PL / SQL过程。