正则表达式 - 在最右边的斜杠出现时拆分字符串[Hive]

时间:2017-12-08 14:58:36

标签: regex string hiveql

我想根据最右边的斜杠出现来拆分路径字符串。文件夹深度是可变的 - 我不知道我有多少斜杠。是否有可能为此创建正则表达式?我在用于SPLIT功能的HIVE查询中使用它。

例如:

原始字符串

/IP/backup_jun20_2017/proddb/application_profile/mth_end_dt=2016-10-31/000000_0

分手后:

字符串1

/IP/backup_jun20_2017/proddb/application_profile/mth_end_dt=2016-10-31

字符串2

000000_0

1 个答案:

答案 0 :(得分:3)

尝试使用此正则表达式(.*)\/(.*?)$(.*)\/([^\/]+)

哪个匹配两个组(.*)最后一个斜杠之前的第一个组,最后一个斜杠之后的第二个组,你可以像\/(.*?)$([^\/]+)

那样匹配