计算Postgres中两行之间的百分比变化

时间:2016-10-31 11:22:15

标签: sql postgresql percentage difference

我有一张200多个国家的年度价值表。对于图形表示,我想获得1990年和2013年两个特定年份之间的百分比变化。

该表看起来有点像这样:

  id_country       year       value
    886            2002      161.348
    886            2003      161.348
    886            2004      176.016
    886            2005      176.016
    886            2006      179.683
    886            2007      183.35
    886            2008      201.685
    886            2009      227.354
    886            2010      234.688
    886            2011      245.689
    886            2012      293.36
    886            2013      440.04
    620            1990      40.337
    620            1991      1056.096
    620            1992      1151.438
    620            1993      1389.793
    620            1994      1584.144
    620            1995      1631.815
    620            1996      1749.159
    620            1997      1796.83
    620            1998      1906.84
    620            1999      1664.818
    620            2000      1642.816
    620            2001      2016.85
    620            2002      1760.16
    620            2003      1873.837
    620            2004      1961.845
    620            2005      2310.21
    620            2006      2328.545
    620            2007      2361.548
    620            2008      3329.636
    620            2009      3069.279
    620            2010      3098.615
    620            2011      2823.59
    620            2012      3373.64
    620            2013      2948.268

我认为最好的方法是使用id_country生成一个VIEW,计算出差异。但我不知道该查询会是什么样子。它必须SELECT所有国家/地区,然后year = 2013除以year = 1990每个国家/地区。

由于该表中有多个变量(由其他列表示),可能会变得更加复杂,需要通过其他列值进行过滤,例如id_source = 1id_source = 2,或者id_sector = 1id_sector = 2

非常感谢任何帮助!

1 个答案:

答案 0 :(得分:1)

一种方式,可能最快:

CREATE VIEW pct_2013_1990 AS
SELECT id_country
     ,       (sum(value) FILTER (WHERE year = 2013) * 100)
     / NULLIF(sum(value) FILTER (WHERE year = 1990), 0) AS pct
FROM   tbl
WHERE  year IN (1990, 2013)
AND    id_source = 1 -- ??
GROUP  BY id_country
-- ORDER BY ???

这假设您有一个值> 1990年每个国家为0,否则你会得到零除以。我在示例中使用NULLIF进行辩护。在这种情况下,结果为NULL。

pct是与1990年相比2013年价值的百分比。要获得百分比变化,您将从中减去100。不确定你需要什么。

您可以使用round()来减少小数位数。

Postgres 9.4引入了聚合FILTER子句:

在旧版本中,您可以使用CASE表达式替换。

您可以使用set-returns函数代替并对年份进行参数化,使其适用于任何一组年份。

CREATE FUNCTION f_pct_calc(year1 integer, year2 integer)
  RETURNS TABLE(id_country int, pct numeric) AS
$func$ 
    SELECT t.id_country
         ,       (sum(t.value) FILTER (WHERE year = $2) * 100)
         / NULLIF(sum(t.value) FILTER (WHERE year = $1), 0) AS pct
    FROM   tbl t
    WHERE  t.year IN ($1, $2)
    AND    t.id_source = 1 -- ??
    GROUP  BY t.id_country
    -- ORDER BY ???
$func$ LANGUAGE sql STABLE;

呼叫:

SELECT * FROM f_pct_calc(1990, 2013);