我正在寻找一个正则表达式模式来选择除锚标记之外的所有html标记。
我一直在试图调整我发现的here以下的正则表达式,但这是使我的眼睛流血的那些模式之一。这种模式看起来非常彻底,所以我希望能够把它固定下来以避免锚标记。
</?\w+((\s+\w+(\s*=\s*(?:".*?"|'.*?'|[^'">\s]+))?)+\s*|\s*)/?>
答案 0 :(得分:1)
您想要搜索,而不是验证标记,因此请使用简单的正则表达式模式</?(?![aA]\b)\w+\b[^>]*>
答案 1 :(得分:0)
我最终在我的第一篇文章中使用了原始模式来选择所有html标签,然后循环遍历每个标签,只留下锚标签。这种模式比其他建议的模式更可靠。 谢谢你的帮助。