如何在HIVE中使用regexp_replace函数,我可以从此字符串中删除标记:
Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>
我想得到:Abc abc abc abc abc 有谁知道吗?
答案 0 :(得分:0)
假设列WTF包含
Abc abc“,”&lt; a href =“http://,557244.html”id =“”&gt; abc abc abc。&lt; / a&gt;
然后regexp_replace(regexp_replace(WTF,'<[^>]*>',''), '[",.]','')
删除所有XML标记内容,然后删除标点符号,以返回
Abc abc abc abc abc
这是普通的旧正则表达式语法,没有特定于Hive。