我尝试抓取以下网站:www.20min.ch
当我读取带有以下代码的节点时
var article_image_attributes = article_image.Descendants(“ img”)。ToList(); foreach(article_image_attributes中的var article_image_attribute) { article_img_src = article_image_attribute.ChildAttributes(“ src”)。FirstOrDefault()。Value;
var article_img_alt_null = article_image_attribute.ChildAttributes("alt").FirstOrDefault();
if (article_img_alt_null != null) { article_img_alt = article_img_alt_null.Value; }
break;
}
break;
我得到以下值:
article_img_src = article_image_attribute.ChildAttributes(“ src”)。FirstOrDefault()。Value:
article_img_src =“ data:image / svg + xml; base64,PHN2ZyB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciIHZpZXdCb3g9IjAgMCAxIDEiPjxWYXIGZbIZIZMZIZIZMZIZMZIZMZIZMZIZIZIZIZIZIZIZI全球贸易网
为什么我无法获得SRC网址为“ https://cdn.uniycms.io ...”? 我必须在这里更改什么?