我希望在hive中最后出现匹配模式

时间:2018-06-07 13:56:23

标签: hive hiveql

string="[(ETLCoreB15,COB-W#2018-05-25, [ETLCoreB4,ETLCoreB15],[ETLCoreB1,ETLCoreB15]),(ETLCoreB20,COB-A#2018-05-25, [ETLCoreB8,ETLCoreB20],[ETLCoreB1,ETLCoreB20])]"

我想使用etlcoreb1

将输出作为最后regex_extract

1 个答案:

答案 0 :(得分:0)

使用split()进行字符串拆分,regex_replacetranslate删除一些字符。我已经评论了我在代码中的每一步做了些什么。您的字符串已解析:

select    split(
           translate(
            split(
               split(
                 regexp_replace(str,'^\\[|\\]$',''), --remove outer []
              '\\)\\s*,')[1], --split by )<any spaces>comma and take second string, which is second struct
            '\\]\\s*,')[1], --split by ]<any spaces>comma  got [ETLCoreB1,ETLCoreB20])
             '([])',''), --remove ()[] characters
            ',')[0] --split by comma and take first element

from
(select '[(ETLCoreB15,COB-W#2018-05-25, [ETLCoreB4,ETLCoreB15],[ETLCoreB1,ETLCoreB15]),(ETLCoreB20,COB-A#2018-05-25, [ETLCoreB8,ETLCoreB20],[ETLCoreB1,ETLCoreB20])]' as str) s

结果:

OK
ETLCoreB1
Time taken: 1.414 seconds, Fetched: 1 row(s)

希望你能抓住这个想法。