我必须从下面提到的字符串中单独生成日期,因为它将在配置单元查询中每天更改

时间:2018-10-10 08:11:27

标签: hive

如何使用蜂巢中的substrregexp_extract函数从以下字符串中生成'19920121 ',因为文件名每天都会随着日期而变化?

  

hdfs://abcdef001.abc.com:8020 / hadoop / dev / ops360 / etl / raw / eods / datalak_big_driver / input / datalak_big_driver_19920121.dat

1 个答案:

答案 0 :(得分:0)

我假设日期部分在文件末尾。下面的一个工作。试试吧

select regexp_extract('hdfs://abcdef001.abc.com:8020/hadoop/dev/ops360/etl/raw/eods/datalak_big_driver/input/datalak_big_driver_19920121.dat',"(\\d+)\.dat", 1);

+-----------+--+
|    _c0    |
+-----------+--+
| 19920121  |
+-----------+--+