在Hive中使用Regex从路径中提取主目录

时间:2019-06-03 23:51:53

标签: regex hive hiveql

我正在使用Hive中的regex函数查找主文件夹。

我想从此文件路径中解析“ main”:

/main/one/path/to/hdfs

这是我使用的正则表达式:

regexp_extract(filepath,'(^/[^/]+)',0)

2 个答案:

答案 0 :(得分:1)

您必须用“ \”转义“ /”

Bottom

答案 1 :(得分:0)

我猜想我们希望在斜杠后得到第一个目录,我们可能要从这个简单的表达式开始:

\/(.+?)\/.+

在这里,我们在第一个捕获组中捕获了main输出:

(.+?)

我们可以简单地使用组1来调用它,我们的代码可能类似于:

regexp_extract(filepath,'\/(.+?)\/.+', 1)

Demo