计算时间戳之间的营业时间

时间:2013-06-25 12:14:45

标签: sql postgresql sqlalchemy

我正在使用Postgres 8.3(此时版本中没有选择)。我的原始数据表如下:

ID  start_time               finish_time
01   2013-01-23 10:47:52-05  2013-02-25 11:18:36-05

我可以在两个时间戳之间计算:

--relevant line in view creation query:
date_part('epoch',(finish_time - start_time)::interval)/3600 as hours

我不想包括周末。另外,我只想算09:00 - 17:30。

在一个完美的世界里,我每天还会减去一个小时的午餐时间,最后我还想包括公司假期,但我想首先解决这个工作时间部分。

有关如何处理此事的任何建议?我对SQL很新。我也习惯使用SQLalchemy,但我也是初学者,对直接SQL感觉更舒服。

2 个答案:

答案 0 :(得分:4)

想象一下,你有一张工作时间表。 (或者构建一个。这个没有经过测试,所以它可能包含时区和fencepost错误。)

create table work_minutes (
  work_minute timestamp primary key
);

insert into work_minutes
select work_minute
from 
  (select generate_series(timestamp '2013-01-01 00:00:00', timestamp '2013-12-31 11:59:00', '1 minute') as work_minute) t
where extract(isodow from work_minute) < 6
  and cast(work_minute as time) between time '09:00' and time '17:30'

现在你的查询可以计算几分钟,而这很简单。

select count(*)/60.0 as elapsed_hrs
from work_minutes
where work_minute between '2013-01-23 10:47:52' and '2013-02-25 11:18:36'

elapsed_hours
--
196.4

您可以决定如何处理小时数。

按分钟计算和按小时计算之间可能存在很大差异,具体取决于您如何处理开始时间等。基于小时数的计算可能不会计算超过停止时间的一小时内的很多分钟。它是否重要依赖于应用程序。

您可以使用generate_series()动态生成这样的虚拟表,但像这样的基表只需要大约400万行才能覆盖30年,而且这种计算速度非常快。

稍后。 。

我看到Erwin Brandstetter covered the use of generate_series() for modern PostgreSQL;它在版本8.3中不起作用,因为8.3不支持公共表表达式或generate_series(时间戳,时间戳)。这是Erwin查询的一个版本,可以避免这些问题。这不是一个完全忠实的翻译;计算方法相差一小时。这对我来说可能是一个障碍错误,但我现在没有时间深入研究细节。

select count(*) from 
(select timestamp '2013-01-23 10:47:52-05' + (n || ' hours')::interval
from generate_series(  0
                     , (extract(days from timestamp '2013-02-25 11:18:36-05' 
                                        - timestamp '2013-01-23 10:47:52-05')::integer * 24) ) n
where extract(isodow from (timestamp '2013-01-23 10:47:52-05' + (n || ' hours')::interval)) < 6
  and (timestamp '2013-01-23 10:47:52-05' + (n || ' hours')::interval)::time >= '09:00'::time
  and (timestamp '2013-01-23 10:47:52-05' + (n || ' hours')::interval)::time <  '17:30'::time
 ) t

基于表格的解决方案具有易于处理管理奇思妙想的优势。 “嘿!我们的狗有七只小狗!今天半天!”它也可以很好地扩展,几乎可以在任何平台上运行而无需修改。

如果使用generate_series(),请将其包装在视图中。这样,可以在一个地方管理对规则的任意更改。如果规则变得太复杂而无法在视图中轻松维护,则可以使用具有相同名称的表替换视图,并且所有应用程序代码,SQL以及存储过程和函数都可以正常工作。

答案 1 :(得分:3)

这会推进work in progress provided by @Catcall

SELECT count(*)
FROM   generate_series(0, extract(days from timestamp '2013-02-25 11:18:36' 
                                          - timestamp '2013-01-23 10:47:52')::int * 24) n
WHERE  extract(ISODOW from timestamp '2013-01-23 10:47:52' + n * interval '1h') < 6
AND   (timestamp '2013-01-23 10:47:52' + n * interval '1h')::time >= '09:00'::time
AND   (timestamp '2013-01-23 10:47:52' + n * interval '1h')::time <  '17:30'::time
  • timestamp '2013-01-23 10:47:52-05'没有做你想象的事情。由于您将文字转换为-05,因此会丢弃时区偏移timestamp [without timezone]。 你可能想要timestamptz '2013-01-23 10:47:52-05'。 但是,工作时间通常与当地时间有关,因此可以认为timestamp [without time zone]更适合开始。更多相关答案:
    Ignoring timezones altogether in Rails and PostgreSQL

  • 这种形式效率更高

    timestamptz '2013-01-23 10:47:52-05' + n * interval '1h'
    

    比这个:

    timestamptz '2013-01-23 10:47:52-05' + (n || ' hours')::interval
    

    您可以简单地乘以任何间隔。

功能

我进一步发展并将其包装成SQL函数 仍然不精确,但它修复了系统误差,并且由于半小时单位而具有较小的舍入误差。

CREATE OR REPLACE FUNCTION f_worktime83(t_start timestamp
                                      , t_end timestamp)
  RETURNS interval AS
$func$

SELECT (count(*) - 1) * interval '30 min' -- fix off-by-one error
FROM   (
   SELECT $1 + generate_series(0, (extract(epoch FROM $2 - $1)/1800)::int)
             * interval '30 min' AS t
   ) sub
WHERE  extract(ISODOW from t) < 6
AND    t::time >= '09:00'::time
AND    t::time <  '17:30'::time

$func$  LANGUAGE sql

呼叫:

SELECT f_worktime83('2013-06-26 10:47:52', '2013-06-26 11:10:51')
  • 直接向generate_series()添加值,简化代码。
  • 通过提取epoc(秒数)并将其除以1800(30分钟内的秒数)来获得(舍入的)精确时间单位数。
  • 修复包含计数中上边框的1分之一错误。