我正在使用Hive中的regex函数查找主文件夹。
我想从此文件路径中解析“ main”:
/main/one/path/to/hdfs
这是我使用的正则表达式:
regexp_extract(filepath,'(^/[^/]+)',0)
答案 0 :(得分:1)
您必须用“ \”转义“ /”
Bottom
答案 1 :(得分:0)
我猜想我们希望在斜杠后得到第一个目录,我们可能要从这个简单的表达式开始:
\/(.+?)\/.+
在这里,我们在第一个捕获组中捕获了main
输出:
(.+?)
我们可以简单地使用组1
来调用它,我们的代码可能类似于:
regexp_extract(filepath,'\/(.+?)\/.+', 1)