SQL查询:计算时间序列中的增量

时间:2013-02-05 21:36:18

标签: sql ms-access

对于一个发展援助项目,我正在帮助尼加拉瓜的一个小镇改善他们的水网管理。

大约有150个家庭,每个月每个人都会根据消耗的水来检查水表并收取房屋费用(从本月读数减去上个月的读数)。今天所有这些都是在纸上完成的,我想将管理数字化以避免计算错误。

我有一个MS Access Table - 例如:

*HousholdID*  *Date*     *Meter*
0             1/1/2013   100
1             1/1/2013   130
0             1/2/2013   120
1             1/2/2013   140
...

根据这些数据,我想创建一个计算消耗水量的查询(一个家庭在两个月之间的差异)

*HouseholdID*  *Date*     *Consumption*
0              1/2/2013   20
1              1/2/2013   10
...

请问,我该如何解决这个问题?

5 个答案:

答案 0 :(得分:3)

此查询返回上一个日期的每个日期,即使缺少月份:

SELECT TabPrev.*, Tab.Meter as PrevMeter, TabPrev.Meter-Tab.Meter as Diff
FROM (
  SELECT
    Tab.HousholdID,
    Tab.Data,
    Max(Tab_1.Data) AS PrevData,
    Tab.Meter
  FROM
    Tab INNER JOIN Tab AS Tab_1 ON Tab.HousholdID = Tab_1.HousholdID
                                 AND Tab.Data > Tab_1.Data
  GROUP BY Tab.HousholdID, Tab.Data, Tab.Meter) As TabPrev
  INNER JOIN Tab
  ON TabPrev.HousholdID = Tab.HousholdID
     AND TabPrev.PrevData=Tab.Data

结果如下:

HousholdID  Data        PrevData    Meter  PrevMeter  Diff
----------------------------------------------------------
0           01/02/2013  01/01/2013  120    100        20
1           01/02/2013  01/01/2012  140    130        10

上面的查询将返回每个家庭每个月(或每个间隔)的每个增量。如果您只对最后一个delta感兴趣,可以使用此查询:

SELECT
  MaxTab.*,
  TabCurr.Meter as CurrMeter,
  TabPrev.Meter as PrevMeter,
  TabCurr.Meter-TabPrev.Meter as Diff
FROM ((
  SELECT
    Tab.HousholdID,
    Max(Tab.Data) AS CurrData,
    Max(Tab_1.Data) AS PrevData
  FROM
    Tab INNER JOIN Tab AS Tab_1
        ON Tab.HousholdID = Tab_1.HousholdID
           AND Tab.Data > Tab_1.Data
  GROUP BY Tab.HousholdID) As MaxTab
  INNER JOIN Tab TabPrev
  ON TabPrev.HousholdID = MaxTab.HousholdID
     AND TabPrev.Data=MaxTab.PrevData)
  INNER JOIN Tab TabCurr
  ON TabCurr.HousholdID = MaxTab.HousholdID
     AND TabCurr.Data=MaxTab.CurrData

和(取决于你所追求的)你只能过滤当前月份:

WHERE
  DateSerial(Year(CurrData), Month(CurrData), 1)=
  DateSerial(Year(DATE()), Month(DATE()), 1)

这样,如果您错过了特定家庭的支票,则不会显示。 或者您可能有兴趣在表格中显示上个月(可能与当月不同):

WHERE
  DateSerial(Year(CurrData), Month(CurrData), 1)=
  (SELECT MAX(DateSerial(Year(Data), Month(Data), 1))
  FROM Tab)

(这里我考虑的是检查可能在不同的日子)

答案 1 :(得分:2)

使用以下数据进行测试:

HousholdID  Date        Meter
0           01/12/2012  100
1           01/12/2012  130
0           01/01/2013  120
1           01/01/2013  140
0           01/02/2013  120
1           01/02/2013  140

以下查询:

SELECT a.housholdid, 
   a.date, 
   b.date, 
   a.meter, 
   b.meter, 
   a.meter - b.meter AS Consumption
FROM   (SELECT * 
    FROM   water 
    WHERE  Month([date]) = Month(Date()) 
           AND Year([date])=year(Date())) a 
   LEFT JOIN (SELECT *
              FROM water
              WHERE DateSerial(Year([date]),Month([date]),Day([date]))
               =DateSerial(Year(Date()),Month(Date())-1,Day([date])) ) b 
   ON a.housholdid = b.housholdid 

以上查询选择了本月Month([date]) = Month(Date())的记录,并将其与上个月([date]) = Month(Date()) - 1)的记录进行比较

请不要将日期用作字段名称。

返回以下结果。

housholdid  a.date      b.date      a.meter b.meter Consumption
0           01/02/2013  01/01/2013  120     100     20
1           01/02/2013  01/01/2013  140     130     10

答案 2 :(得分:2)

我认为最好的方法是使用相关子查询来获取上一个日期并加入到原始表中。这可确保您获得之前的记录,即使存在多于或少于1个月的延迟。

所以正确的查询如下:

select t.*, tprev.date, tprev.meter
from (select t.*,
             (select top 1 date from t t2 where t2.date < t.date order by date desc
             ) prevDate
      from t
     ) join
     t tprev
     on tprev.date = t.prevdate

在您描述的环境中,非常重要的是不要对读取仪表的频率做出假设。虽然每月平均可以阅读一次,但总会有例外情况。

答案 3 :(得分:1)

尝试

select  t.householdID
       , max(s.theDate) as billingMonth
       , max(s.meter)-max(t.meter) as waterUsed
from    myTbl t join (
    select  householdID, max(theDate) as theDate, max(meter) as meter
    from    myTbl 
    group by householdID ) s 
        on t.householdID = s.householdID and t.theDate <> s.theDate
group by t.householdID

这适用于SQL,不确定访问

答案 4 :(得分:0)

您可以在某些SQL方言中使用LAG()函数。我发现这比连接更快更容易阅读。

来源:http://blog.jooq.org/2015/05/12/use-this-neat-window-function-trick-to-calculate-time-differences-in-a-time-series/