正则表达式选择除A以外的HTML标记

时间:2012-09-10 23:31:31

标签: regex

我正在寻找一个正则表达式模式来选择除锚标记之外的所有html标记。

我一直在试图调整我发现的here以下的正则表达式,但这是使我的眼睛流血的那些模式之一。这种模式看起来非常彻底,所以我希望能够把它固定下来以避免锚标记。

</?\w+((\s+\w+(\s*=\s*(?:".*?"|'.*?'|[^'">\s]+))?)+\s*|\s*)/?>

2 个答案:

答案 0 :(得分:1)

您想要搜索,而不是验证标记,因此请使用简单的正则表达式模式</?(?![aA]\b)\w+\b[^>]*>

答案 1 :(得分:0)

我最终在我的第一篇文章中使用了原始模式来选择所有html标签,然后循环遍历每个标签,只留下锚标签。这种模式比其他建议的模式更可靠。 谢谢你的帮助。