我正在尝试使用一个正则表达式来匹配文本文件中的打开和关闭HTML标记。任何帮助都会很棒,所有我能想到的都是<[^>]*>
,这是我最推荐的正则表达式。我应该提一下,我正在使用VS 2010和C#。
答案 0 :(得分:1)
AFAIK使用正则表达式找不到嵌套的html标签是不可能的。例如。如果输入类似于<b>some phrase <b>double bolded</b> another phrase</b>
,则无法使用正则表达式匹配正确的开始和结束标记。如果嵌套级别是固定且已知的,则可能,但由于HTML中不是这种情况,因此正则表达式不起作用。
答案 1 :(得分:1)
认为您需要以下内容。这包括自动关闭标签和结束标签的选项
"</?[a-zA-z]* ?/?>"