HTML标记的正则表达式

时间:2012-02-01 12:39:29

标签: c# html regex

我正在尝试使用一个正则表达式来匹配文本文件中的打开和关闭HTML标记。任何帮助都会很棒,所有我能想到的都是<[^>]*>,这是我最推荐的正则表达式。我应该提一下,我正在使用VS 2010和C#。

2 个答案:

答案 0 :(得分:1)

AFAIK使用正则表达式找不到嵌套的html标签是不可能的。例如。如果输入类似于<b>some phrase <b>double bolded</b> another phrase</b>,则无法使用正则表达式匹配正确的开始和结束标记。如果嵌套级别是固定且已知的,则可能,但由于HTML中不是这种情况,因此正则表达式不起作用。

答案 1 :(得分:1)

认为您需要以下内容。这包括自动关闭标签和结束标签的选项

"</?[a-zA-z]* ?/?>"