我是athena的新手。
有没有办法从此输入中获得预期的输出?
输入(csv文件具有以下输入内容)
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-02 | 333 | 1
2017-01-03 | 444 | 1
预期输出
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-01 | 333 | 0
2017-01-01 | 444 | 0
2017-01-02 | 111 | 1
2017-01-02 | 222 | 1
2017-01-02 | 333 | 1
2017-01-02 | 444 | 0
2017-01-03 | 111 | 1
2017-01-03 | 222 | 1
2017-01-03 | 333 | 1
2017-01-03 | 444 | 1
答案 0 :(得分:0)
这是示例查询操作方法:
select t1."DATE (yyyymmdd)",t2.ip from
(SELECT "DATE (yyyymmdd)" FROM tab1 group by "DATE (yyyymmdd)") t1,
(SELECT ip FROM tab2 group by ip) t2
在此“选择”中使用笛卡尔联接,因此不能将其应用于大数据集,因为这会发生性能问题。