使用HTML敏捷包提取img src

时间:2019-04-03 08:10:06

标签: c# html-agility-pack

我正在使用HTMLAgility Pack抓取网站(https://www.greenlee.com/us/en/elec-bender-classic-w-single-emt-shoes-555esc)。我想获取图像src。但是,我得到一个空结果(?)。

这是我的代码:

HtmlWeb web = new HtmlWeb();
var htmldoc = web.Load(theurl);
var htmlnode = htmldoc.DocumentNode.SelectNodes("//div[contains(@class,'thumb-sizer')");

 foreach (var item in htmlnode)
 {
    Console.WriteLine(item.InnerHtml);
 }

现在,结果就是这样(在查看Pagesource时)

<img ng-src="{{image.thumbnailUrl}}" alt="{{image.title}}" title="{{image.title}}">

但是,在开发人员工具中,我看到了

<div class="thumb-sizer">
    <img ng-src="https://cdn.greenlee.com/resources/images/c039f03f-cb77- 
    4c28-9a78-af339c773365" alt="ELECTRIC BENDER CLASSIC W/SINGLE EMT 
    SHOES" title="ELECTRIC BENDER CLASSIC W/SINGLE EMT SHOES" 
    src="https://cdn.greenlee.com/resources/images/c039f03f-cb77-4c28- 
    9a78-af339c773365">
</div>

我做了一些研究,很遗憾,我还没有找到解决方法。我想提取 img src 链接或值,但是从 InnerHtml 的结果中,没有src值。

0 个答案:

没有答案