如何使用蜂巢中的substr
或regexp_extract
函数从以下字符串中生成'19920121 ',因为文件名每天都会随着日期而变化?
hdfs://abcdef001.abc.com:8020 / hadoop / dev / ops360 / etl / raw / eods / datalak_big_driver / input / datalak_big_driver_19920121.dat
答案 0 :(得分:0)
我假设日期部分在文件末尾。下面的一个工作。试试吧
select regexp_extract('hdfs://abcdef001.abc.com:8020/hadoop/dev/ops360/etl/raw/eods/datalak_big_driver/input/datalak_big_driver_19920121.dat',"(\\d+)\.dat", 1);
+-----------+--+
| _c0 |
+-----------+--+
| 19920121 |
+-----------+--+