带有html标签的字符串的正则表达式

时间:2015-05-28 15:14:43

标签: html regex

我想制作一个正则表达式来查找所有与空格分隔的单词,而不包含包含<span style="color:#FF0000;">

等空格的单独html标记

我做了这个正则表达式: /([^ \ S] +)/

但结果不完整,因为它将html分成如下句子:

bonjour et bienvenue dan<span style="color:#FF0000;"><u><i><b>s ce tutoriel où nous allons</b></i></u></span> <span style="color:#FF0000;">apprendre </span>ici à faire une somme sur Excel donc tout d'abord nous allons voir Axel

1 个答案:

答案 0 :(得分:0)

您可以使用下面的正则表达式使用string.replace去除标记。如果您想要单个单词,则可以将结果字符串拆分为空格。这假设您使用的是javascript,但您可以轻松地将其调整为任何支持正则表达式的语言。

var string = "bonjour et bienvenue dan<span style=\"color:#FF0000;\"><u><i><b>s ce tutoriel où nous allons</b></i></u></span> <span style=\"color:#FF0000;\">apprendre </span>ici à faire une somme sur Excel donc tout d'abord nous allons voir Axel";

var tagsStripped = string.replace(/<[^>]+>/g,'');

alert(tagsStripped);

alert(tagsStripped.split(' '));