正则表达式替换标签来制作有效的HTML

时间:2018-03-03 12:54:00

标签: c# regex regex-negation

我正在尝试转换下面提到的标签:

[caption id="attachment_812" align="alignleft" width="240"]<img class="wp-
image-92692" src="sample.jpg" alt="" width="316" height="210"/>Sample 
text[/caption]

使用正则表达式下面的那个:

<caption id="attachment_812" align="alignleft" width="240"><img class="wp-
image-92692" src="sample.jpg" alt="" width="316" height="210"/>Sample 
text</caption>

所以基本上我想将[caption]标签转换为<caption>。这样它就变成了一个有效的html标签,然后使用html agility pack来解析标签。

以下是C#代码:

//Replace [caption]
htmlSource = Regex.Replace(htmlSource, @"\[caption]", "<caption>");
//Replace [/caption]
htmlSource = Regex.Replace(htmlSource, @"\[/caption]", "</caption>");

这适用于没有属性的字幕标记。我正在寻找一个更好的解决方案来保持属性,只需替换方括号使其成为有效的html标记。

1 个答案:

答案 0 :(得分:4)

Regex.Replace(htmlSource, @"\[(\/*caption.*?)\]", @"<$1>")

请参阅Demo