仅从HTML获取Text部分

时间:2012-06-11 05:23:24

标签: editplus

我在EditPlus中打开了一个HTML页面。我希望删除所有HTML标记,即所有<>标签来自它,所以我只剩下文本部分。我需要用什么正则表达式删除这些。我试过<。>自从。意味着任何角色,但它不起作用。任何人都建议我如何实现这一目标?

1 个答案:

答案 0 :(得分:0)

您可以使用此正则表达式查找所有HTML标记

<([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>

并替换为$2