我在hive表中有一个字符串列
"""hello:world"""
"""abc:|:def"""
我想只提取三重引号中的文字,如
hello:world
abc:|:def
如何在Hive中使用regexp_extract函数来执行此操作?
我在努力,
select '"""hello:world"""' as in , regexp_extract('"""hello:world"""','""".*."""' , 0) as out ;
答案 0 :(得分:1)
可以使用regexp_replace
和regexp_extract
完成此操作。对于regexp_extract
,解决方案假定字符串模式是一致的。
select regexp_replace(col,'"',''),regexp_extract(col,'"""(.*)"""',1)
from tbl