Question

我有一些类似下面的HTML：

<img src="/web/20110208042711im_/http://coralifeaqualight.com/wp-content/themes/xtheme/images/coralife-aqualight-pro.png" alt="">

我希望能够使用正则表达式来清除任何没有值的html属性，在这种情况下：alt =“”。我无法弄清楚如何查找任何带有空格的字符串并且包含=“”，因为它会为我做，有人知道吗

Answer 1

使用正则表达式解析HTML通常被认为是一个坏主意，因为有太多边缘情况。自己读。 http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html

受欢迎的解决方案是HTML Agility Pack

另请参阅此Stackoverflow有关使用Regex for HTML的问题：here

Answer 2

我不是正则表达式的天才，但我相信String.Replace("\s\w+=\"\"", String.Empty)会做到这一点，如果你在字符串中有整个标记。