如何使用正则表达式模式将标记替换为不带引号的属性值

时间:2009-11-12 03:29:56

标签: c# regex markup

考虑以下标记

<p align=center width='100' height=\"200\" attr=test>aasasd</p>

为了使这个标记有效,我想在需要它们的地方包装引号。

从上面的例子我想申请引号,所以标记将是:

<p align="center" width='100' height="200" attr="test">aasasd</p>

有没有人为此目的知道任何正则表达式模式?

我正在使用C#。

编辑: 看起来我可能不得不以另一种方式做到这一点。有人可以为我提供正则表达式来匹配这些值:

align=center 
attr=test

由于

2 个答案:

答案 0 :(得分:2)

正则表达式可能不是解决此问题的正确方法。看看tidyfornet这是HTML Tidy的.Net包装器,这是一个从标签汤生成有效HTML / XHTML的Java包。

答案 1 :(得分:-1)

这样的事情应该有效:/=('|\\"|\s*)([\w])*('|\\"|\s*)\b/