无法删除" style"来自HTML的属性

时间:2017-07-14 07:13:45

标签: c# regex

尝试删除所有属性,除了" src"来自所有html doms。像img或iframe。

我正在使用正则表达式,但不起作用;

    inp = Regex.Replace(inp, @"(<\s*[a-z][a-z0-9]*.*\s)(style\s*=\s*"".*?"")([^<>]*>)", "$1 $3", RegexOptions.Singleline | RegexOptions.IgnoreCase);

我看不到的问题是什么?

1 个答案:

答案 0 :(得分:0)

我的主张是:

找到所有带有模式"<[^>]+>"的html标签,只是删除所有不包含字符串"src"的html标签会不会更简单?