C#如何在HTML中查找1x1图像标记

时间:2017-06-09 07:24:46

标签: c# html regex tracking-pixel

我想知道如何在尺寸为1x1的HTML字符串中查找图像标记,基本上我正在寻找跟踪像素。例如:

<img src=\"http://somewhere.com\" width=\"1\" height=\"1\" style=\"display:none!important;\">

我的最终目标是能够找到代码的这一部分并将其从字符串中删除。

我已经阅读了几篇关于如何找到所有img标签的帖子,但这不是我想要的。我只想要1x1的img标签。

任何人都可以帮忙吗?

2 个答案:

答案 0 :(得分:3)

使用正则表达式解析HTML并不是一个非常好的做法,但我猜你会使用<img>获取所有<img.*?>个标签,然后执行常规

if (str.IndexOf("width=\"1\"" > 0 && str.IndexOf("height=\"1\"") > 0)

但还有更多内容,我建议你看看HTML Agility Pack

答案 1 :(得分:2)

如果您只想从字符串中删除此img标记,可以使用regexp执行此操作:

 string result = Regex.Replace(html, "<img.+?(width|height)=[\"']1[\"'].+?(width|height)=[\"']1[\"'].*>", "", RegexOptions.IgnoreCase);