计算每个国家/地区每天的销售份额

时间:2021-03-15 13:17:40

标签: sql amazon-redshift

DB-Fiddle

CREATE TABLE sales (
    id SERIAL PRIMARY KEY,
    event_date DATE,
    country VARCHAR,
    sales DECIMAL
);

INSERT INTO sales
(event_date, country, sales)
VALUES 
('2020-02-08', 'DE', '500'),
('2020-02-08', 'FR', '900'),
('2020-02-08', 'NL', '700'),
('2020-03-20', 'US', '600'),
('2020-03-20', 'DE', '500'),
('2020-04-15', 'NL', '300'),
('2020-04-15', 'FR', '800'),
('2020-04-15', 'NL', '100');

预期结果:

event_date  |  country  |    sales_share_per_country_per_day    |
------------|-----------|---------------------------------------|-------------
2020-02-08  |    DE     |     0.24  (=500/2100)                 |  
2020-02-08  |    FR     |     0.43  (=900/2100)                 |
2020-02-08  |    NL     |     0.33  (=700/2100)                 |
------------|-----------|---------------------------------------|-------------
2020-03-20  |    US     |     0.55  (=600/1100)                 |
2020-03-20  |    DE     |     0.45  (=500/1100)                 |
------------|-----------|---------------------------------------|-------------
2020-04-15  |    NL     |     0.25  (=300/1200)                 |
2020-04-15  |    FR     |     0.67  (=800/1200)                 |
2020-04-15  |    NL     |     0.08  (=100/1100)                 |

我想计算每个国家/地区每天的销售份额
因此,我尝试使用此查询:

SELECT
s.event_date,
s.country,
s.sales,
SUM(s.sales) OVER (PARTITION BY s.country) AS sales_share_per_day
FROM sales s
GROUP BY 1,2,3
ORDER BY 1;

然而,我无法达到预期的效果。
你知道我必须如何修改查询吗?


注意:最后我将需要这个查询来进行 redshift。
但是,据我所知,对于窗口函数,redshift 使用 postgresSQL 语法。
因此,我在问题中标记了 redshift 和 postgresSQL。
如果这个假设有误,请随时纠正我。

2 个答案:

答案 0 :(得分:0)

sales_share_per_day 四舍五入到小数点后两位

<块引用>
CREATE TABLE sales (
    id SERIAL PRIMARY KEY,
    event_date DATE,
    country VARCHAR,
    sales DECIMAL
);

INSERT INTO sales
(event_date, country, sales)
VALUES 
('2020-02-08', 'DE', '500'),
('2020-02-08', 'FR', '900'),
('2020-02-08', 'NL', '700'),
('2020-03-20', 'US', '600'),
('2020-03-20', 'DE', '500'),
('2020-04-15', 'NL', '300'),
('2020-04-15', 'FR', '800'),
('2020-04-15', 'NL', '100');
<块引用>
        SELECT
        s.event_date,
        s.country,
        s.sales,
        round(s.sales/sum(s.sales) OVER (PARTITION BY event_date ),2) AS sales_share_per_day
        FROM sales s
        ORDER BY 1;
<块引用>
<头>
event_date 国家 销售 sales_share_per_day
2020-02-08 DE 500 0.24
2020-02-08 FR 900 0.43
2020-02-08 NL 700 0.33
2020-03-20 美国 600 0.55
2020-03-20 DE 500 0.45
2020-04-15 NL 300 0.25
2020-04-15 FR 800 0.67
2020-04-15 NL 100 0.08

db<>fiddle here

未四舍五入:

<块引用>
CREATE TABLE sales (
    id SERIAL PRIMARY KEY,
    event_date DATE,
    country VARCHAR,
    sales DECIMAL
);

INSERT INTO sales
(event_date, country, sales)
VALUES 
('2020-02-08', 'DE', '500'),
('2020-02-08', 'FR', '900'),
('2020-02-08', 'NL', '700'),
('2020-03-20', 'US', '600'),
('2020-03-20', 'DE', '500'),
('2020-04-15', 'NL', '300'),
('2020-04-15', 'FR', '800'),
('2020-04-15', 'NL', '100');
<块引用>
        SELECT
        s.event_date,
        s.country,
        s.sales,
        s.sales/sum(s.sales) OVER (PARTITION BY event_date ) AS sales_share_per_day
        FROM sales s
        ORDER BY 1;
<块引用>
<头>
event_date 国家 销售 sales_share_per_day
2020-02-08 DE 500 0.23809523809523809524
2020-02-08 FR 900 0.42857142857142857143
2020-02-08 NL 700 0.33333333333333333333
2020-03-20 美国 600 0.54545454545454545455
2020-03-20 DE 500 0.45454545454545454545
2020-04-15 NL 300 0.25000000000000000000
2020-04-15 FR 800 0.66666666666666666667
2020-04-15 NL 100 0.08333333333333333333

db<>fiddle here

答案 1 :(得分:0)

这是你追求的吗?

SELECT
s.event_date,
s.country,
s.sales,
(
   s.sales 
 / SUM(s.sales) OVER(PARTITION BY event_date)
)::NUMERIC(9,2) AS sales_pct_per_day,
SUM(s.sales) OVER(PARTITION BY event_date) AS sales_share_per_day
FROM sales s
GROUP BY 1,2,3
ORDER BY 1;
event_date  country sales   sales_pct_per_day   sales_share_per_day
2020-02-08  DE      500         0.24                2100
2020-02-08  FR      900         0.43                2100
2020-02-08  NL      700         0.33                2100
2020-03-20  US      600         0.55                1100
2020-03-20  DE      500         0.45                1100
2020-04-15  FR      800         0.67                1200
2020-04-15  NL      300         0.25                1200
2020-04-15  NL      100         0.08                1200