使用SQL从文本中删除HTML标记

时间:2017-04-23 13:01:51

标签: sql oracle

我的表格中包含HTML文本(数据包含HTML标记)以及普通文本。

我需要删除数据中存在的HTML标记。

我计划的步骤:

  1. 仅过滤包含HTML标记的记录。 - >我能够完成这一步。我的逻辑:HTMLStirng喜欢('<%>%')
  2. 用空格替换HTML标记。 - >我正在尝试应用替换功能。但我无法做到。
  3. 例如:

    <p>Paragraph</p>
    <b>bold</b><I>Italic</I>
    Normal Text
    

    我的输出应该是:

    Paragraph
    BoldItalic
    Normal Text
    

    有人可以在第2步中帮助我吗?

1 个答案:

答案 0 :(得分:2)

如果您使用的是Oracle,请尝试以下

SELECT Regexp_replace(your_column_name, '<.+?>') 
FROM   dual;

实施例

SELECT Regexp_replace('<b>bold</b><I>Italic</I> Testing', '<.+?>') 
FROM   dual;