用Sql计算酒店的峰值容量

时间:2012-11-16 20:23:15

标签: sql oracle oracle11gr2

有许多酒店拥有不同的床位。我需要知道,在任何一天,每家酒店都会占用多少张床。

示例数据:

 HOTEL      CHECK-IN     CHECK-OUT
   A       29.05.2010   30.05.2010
   A       28.05.2010   30.05.2010
   A       27.05.2010   29.05.2010
   B       18.08.2010   19.08.2010
   B       16.08.2010   20.08.2010
   B       15.08.2010   17.08.2010

中介结果:

HOTEL      DAY          OCCUPIED_BEDS
  A     27.05.2010           1      
  A     28.05.2010           2
  A     29.05.2010           3
  A     30.05.2010           2
  B     15.08.2010           1
  B     16.08.2010           2
  B     17.08.2010           2
  B     18.08.2010           2
  B     19.08.2010           2
  B     20.08.2010           1

最终结果:

 HOTEL     MAX_OCCUPATION  
   A            3
   B            2

A similar question is asked before.我想在两个日期之间获取日期列表(as Tom Kyte shows),并使用group by计算每天的容量。问题是我的桌子相对较大,我想知道是否有成本较低的方法来完成这项任务。

3 个答案:

答案 0 :(得分:2)

创建一个包含您感兴趣的日子的临时表

create table #dates (dat datetime)
insert into #dates (dat) values ('20121116')
insert into #dates (dat) values ('20121115')
insert into #dates (dat) values ('20121114')
insert into #dates (dat) values ('20121113')

通过将预订与日期相结合来获得中间结果,以便每个预订日一个“生成”

SELECT Hotel, d.dat, COUNT(*) from bookings b
INNER JOIN #dates d on d.dat BETWEEN b.checkin AND b.checkout
GROUP BY Hotel, d.dat 

最后得到Max

SELECT Hotel, Max(OCCUPIED_BEDS) FROM IntermediateResult GROUP BY Hotel

答案 1 :(得分:2)

我认为没有比你在问题中概述的方法更好的方法。创建您的日历表(或动态生成一个表)。我个人喜欢躺着,每年更新一次。

理解分析函数的人可能会在没有内部/外部查询的情况下执行此操作,但由于内部分组是外部的子集,因此它没有太大区别。

Select
  i.Hotel,
  Max(i.OccupiedBeds)
From (
  Select
    s.Hotel,
    d.DayID,
    Count(*) As OccupiedBeds
  From
    SampleData s
      Inner Join
    Days d
      -- might not need to +1 depending on business rules.
      -- I wouldn't count occupancy on the day I check out, if so get rid of it
      On d.DayID >= s.CheckIn And d.DayID < s.CheckOut + 1 
  Group By
    s.Hotel, 
    d.DayID
  ) i
Group By
  i.Hotel

经过一段时间的游戏,我无法在没有内部查询的情况下使用分析函数版本:

如果速度确实是一个问题,你可以考虑在主表上维护一个带触发器的中间表。

http://sqlfiddle.com/#!4/e58e7/24

答案 2 :(得分:1)

性能问题是连接条件不是基于相等性,这使得哈希连接成为不可能。假设我们有一个酒店 - 日酒店日对表,我会尝试这样的事情:

select ch_in.hotel, ch_in.day,
       (check_in_cnt - check_out_cnt) as occupancy_change
from   ( select d.hotel, d.day, count(s.hotel) as check_in_cnt
         from   hotel_days d,
                sample_data s
         where  s.hotel(+) = d.hotel
           and  s.check_in(+) = d.day
         group  by d.hotel, d.day
       ) ch_in,
       ( select d.hotel, d.day, count(s.hotel) as check_out_cnt
         from   hotel_days d,
                sample_data s
         where  s.hotel(+) = d.hotel
           and  s.check_out(+) = d.day
         group  by d.hotel, d.day
       ) ch_out
where  ch_out.hotel = ch_in.hotel
  and  ch_out.day = ch_in.day

权衡是双重全扫描,但我认为它仍然会运行得更快,并且可以并行化。 (我假设sample_data很大,主要是由于预订的数量,而不是酒店本身的数量。)输出是特定日期特定酒店的入住率变化,但这可以很容易地总结为总价值与任何分析函数或(可能更有效)使用批量收集的PL / SQL过程。