正则表达式查找不在任何标签内的单词

时间:2016-03-13 22:22:06

标签: regex

我有一个字符串示例:

<a href="#location">location</a> <br> word1 :-) <br>

我需要拆分它,所以我得到一个位置,我可以打破这个字符串所以它不会破坏标签和单词所以基本上我想找到一个不在任何标签内的空格字符。 我创建了一个匹配标签的正则表达式

<\w+.*/\w*?>

如何排除它,以便“<a href”之间的空格不匹配。

更新 我需要在不破坏标签和单词的情况下将此字符串拆分为2 即

<a href="#location">location</a>

&安培;

<br> word1 :-) <br>

1 个答案:

答案 0 :(得分:1)

也许这就是你要找的东西:

(?:<(\w+).*?(\/(\1))>|<\w+\/?>|\S+)

<(\w+).*?(\/(\1))> will match for tags like <a> ds</a>
<\w+\/?> will match for <br>,</br> etc
\S+ will match for whole word.