在2个季度之间选择数据

时间:2019-04-25 09:00:22

标签: apache-spark apache-spark-sql

我有一个数据集,其中的列是年份和季度的串联

Fiscal_Quarter  Revenue
FY18  Q4    100
FY18  Q4    100
FY18  Q4    100
FY18  Q4    400
FY18  Q4    100
FY19  Q1    100
FY19  Q1    300
FY19  Q1    100
FY19  Q2    200
FY19  Q2    100
FY19  Q2    500
FY19  Q2    100
FY19  Q2    100

我想选择FY18 Q4和FY19 Q1的数据,我该如何编写spark sql以仅使用之间和运算符来选择这两个季度的数据。

如果四分之一的数目只能在子句中执行,则用户可以配置。但是由于用户可以输入Begin Year = 2018 Begin Quarter = Q4 和结束年份= 2020结束季度=第四季度。我不能做in运算符,所以最好在in和操作之间进行。

select fiscal_quarter,sum(revenue) from table1 where fiscal_quarter between 'FY18 Q4' and 'FY19 Q1'

,但结果并不总是正确的。

预期产量

Fiscal_Quarter  Revenue
FY18  Q4    800
FY19  Q1    600

0 个答案:

没有答案