我有一些类似下面的HTML:
<img src="/web/20110208042711im_/http://coralifeaqualight.com/wp-content/themes/xtheme/images/coralife-aqualight-pro.png" alt="">
我希望能够使用正则表达式来清除任何没有值的html属性,在这种情况下:alt =“”。 我无法弄清楚如何查找任何带有空格的字符串并且包含=“”,因为它会为我做,有人知道吗
答案 0 :(得分:1)
使用正则表达式解析HTML通常被认为是一个坏主意,因为有太多边缘情况。自己读。 http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html
受欢迎的解决方案是HTML Agility Pack
另请参阅此Stackoverflow有关使用Regex for HTML的问题:here
答案 1 :(得分:0)
我不是正则表达式的天才,但我相信String.Replace("\s\w+=\"\"", String.Empty)
会做到这一点,如果你在字符串中有整个标记。