HIV中的regexp_replace函数

时间:2015-11-20 15:49:14

标签: hive regexp-replace

如何在HIVE中使用regexp_replace函数,我可以从此字符串中删除标记:

Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a> 

我想得到:Abc abc abc abc abc 有谁知道吗?

1 个答案:

答案 0 :(得分:0)

假设列WTF包含

  

Abc abc“,”&lt; a href =“http://,557244.html”id =“”&gt; abc abc abc。&lt; / a&gt;

然后regexp_replace(regexp_replace(WTF,'<[^>]*>',''), '[",.]','')删除所有XML标记内容,然后删除标点符号,以返回

  

Abc abc abc abc abc

这是普通的旧正则表达式语法,没有特定于Hive。