我怎样才能从网站上抓取图像

时间:2017-08-22 02:30:10

标签: phantomjs

我正试图从网站上搜索图像。当我尝试用src属性抓取图像时,我似乎都很容易。但是当使用srcset引发错误未定义并且不起作用??? 我试过了       var page = require('网页')。create();

page.onLoadFinished = function(){

var urls = page.evaluate(function(){
    var image_urls = new Array;
    var images = document.getElementsByTagName("img");
    for(q = 0; q < images.length; q++){
        images[q].srcset = images[q].src;
        image_urls.push(images[q].src);
    }
    return image_urls;
});    

console.log(urls.length);
console.log(urls[0]);

phantom.exit();
}
page.open('https://www.example.com/Food/Pears/Anjou-Pears');

我想做的就是我可以输入网址并从网址中提取和下载图片。

Upadate:我也试过以下代码来获取img url并让我发现幻影js崩溃了,即#34; PhantomJS已经崩溃了。请阅读错误报告指南 http://phantomjs.org/bug-reporting.html并提交错误报告。 分段错误:11&#34;。

var url = "https://www.example.com/Food/Fruits/Pears/Anjou-Pears/p/20174514001_KG";
var page = require( 'webpage' ).create();

page.open(url, function( status ) {
if ( status === 'success' ) {
    page.includeJs('https://ajax.googleapis.com/ajax/libs/jquery/3.2.1/jquery.min.js', function() {
        var link = page.evaluate(function() {
            if($( 'img' ).length != 0)
            {
                return $( 'img' ).attr('srcset');
            }

        });
        console.log( link );
        phantom.exit();
    });
} else {
    console.log( 'FAIL' );
}
});

0 个答案:

没有答案