使用regexp_extract函数在hive中的三引号内提取字符串

时间:2018-05-14 15:56:58

标签: hive

我在hive表中有一个字符串列

"""hello:world"""
"""abc:|:def"""

我想只提取三重引号中的文字,如

hello:world
abc:|:def

如何在Hive中使用regexp_extract函数来执行此操作?

我在努力,

select '"""hello:world"""' as in , regexp_extract('"""hello:world"""','""".*."""' , 0) as out ; 

1 个答案:

答案 0 :(得分:1)

可以使用regexp_replaceregexp_extract完成此操作。对于regexp_extract,解决方案假定字符串模式是一致的。

select regexp_replace(col,'"',''),regexp_extract(col,'"""(.*)"""',1)
from tbl