Question

我在EditPlus中打开了一个HTML页面。我希望删除所有HTML标记，即所有＆lt;＆gt;标签来自它，所以我只剩下文本部分。我需要用什么正则表达式删除这些。我试过＆lt;。＆gt;自从。意味着任何角色，但它不起作用。任何人都建议我如何实现这一目标？

Answer 1

您可以使用此正则表达式查找所有HTML标记

<([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>

并替换为$2