我有一个数据集,其中的列是年份和季度的串联
Fiscal_Quarter Revenue
FY18 Q4 100
FY18 Q4 100
FY18 Q4 100
FY18 Q4 400
FY18 Q4 100
FY19 Q1 100
FY19 Q1 300
FY19 Q1 100
FY19 Q2 200
FY19 Q2 100
FY19 Q2 500
FY19 Q2 100
FY19 Q2 100
我想选择FY18 Q4和FY19 Q1的数据,我该如何编写spark sql以仅使用之间和运算符来选择这两个季度的数据。
如果四分之一的数目只能在子句中执行,则用户可以配置。但是由于用户可以输入Begin Year = 2018 Begin Quarter = Q4 和结束年份= 2020结束季度=第四季度。我不能做in运算符,所以最好在in和操作之间进行。
select fiscal_quarter,sum(revenue) from table1 where fiscal_quarter between 'FY18 Q4' and 'FY19 Q1'
,但结果并不总是正确的。
预期产量
Fiscal_Quarter Revenue
FY18 Q4 800
FY19 Q1 600