使用HtmlAgilityPack获取IMG SRC URL

时间:2020-08-23 20:16:43

标签: html

我尝试抓取以下网站:www.20min.ch

每篇文章都有自己的图片,我喜欢阅读IMG SRC网址。 enter image description here

当我读取带有以下代码的节点时

var article_image_attributes = article_image.Descendants(“ img”)。ToList(); foreach(article_image_attributes中的var article_image_attribute) { article_img_src = article_image_attribute.ChildAttributes(“ src”)。FirstOrDefault()。Value;

                            var article_img_alt_null = article_image_attribute.ChildAttributes("alt").FirstOrDefault();
                            if (article_img_alt_null != null) { article_img_alt = article_img_alt_null.Value; }
                            break;
                        }
                        break;

我得到以下值:

article_img_src = article_image_attribute.ChildAttributes(“ src”)。FirstOrDefault()。Value:

article_img_src =“ data:image / svg + xml; base64,PHN2ZyB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciIHZpZXdCb3g9IjAgMCAxIDEiPjxWYXIGZbIZIZMZIZIZMZIZMZIZMZIZMZIZIZIZIZIZIZIZI全球贸易网

为什么我无法获得SRC网址为“ https://cdn.uniycms.io ...”? 我必须在这里更改什么?

0 个答案:

没有答案