PhantomJS - WaitFor方法不会执行函数。程序卡住了

时间:2017-04-02 14:02:12

标签: javascript asynchronous phantomjs npn

我在PhantomJS中使用waitFor-Method时遇到了一些麻烦。

这就是我想要做的事情:

  • 按生成的网址加载多个网页
  • 使用jQuery解析该页面中的某些链接
  • 将每个已解析的链接存储在同一个数组中(在此示例中,我只是记录它们)

我正在使用waitFor() -Method,所以我可以等到页面被评估。据我所知,这个方法会阻止程序继续运行,直到我作为参数传递的函数返回任何内容。

我的问题: 实际上,程序在执行waitFor-Method后不会继续运行。它只是卡住了。没有任何错误。我作为参数传递的函数将不会被执行...至少在控制台中没有记录。

当我删除waitFor-Methot时,它将正确执行代码,但是我无法多次执行handleSeriesPageListPage() - Method。我真的不太喜欢js和回调或异步方法处理。我想我做了一些重大错误,一些javascript专家将能够快速帮助我:)。

"use strict";
var page = require('webpage').create();
page.onConsoleMessage = function (msg) {
    console.log(msg);
};
var seriesPageBaseUrl = "https://www.example.com?pageid=";
var simpleBaseUrl = "https://www.example.com/";
var seriesPageIds = [0xx, 1xx];
var allSeriesUrls = [];


function handleSeriesPageListPage(url) {
    console.log("Open url: " + url);
    page.open(url, function (status) {
        console.log("status: " + status);
        if (status === "success") {
            waitFor(
                function () {
                    return page.includeJs("https://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js", function () {
                        console.log("Included JS");
                        return page.evaluate(function () {
                            console.log("evaluate result...");
                            $('.list_item').each(function () {
                                var seriesLink = jQuery(this).find("a").first().attr("href");
                                var seriesUrl = simpleBaseUrl + seriesLink;
                                console.log(seriesUrl);
                                return true;
                            });
                        });
                    });
                }
            );
        } else {
            phantom.exit(1);
        }
    });
}

function nextSeriesListPage() {
    var seriesPageId = seriesPageIds.shift();
    if (typeof seriesPageId === "undefined") {
        console.log(allSeriesUrls);
        phantom.exit(0);
    }
    var targetURL = seriesPageBaseUrl + seriesPageId;
    handleSeriesPageListPage(targetURL);
}

nextSeriesListPage();

1 个答案:

答案 0 :(得分:1)

您使用的waitFor()函数不是处理异步任务的合适方法,实际上您误解了它的作用:

waitFor(testFx, onReady, timeOutMillis)

需要三个参数(第三个参数是可选的)。第一个参数是测试函数。它会重复执行,但每次都是同步执行,直到其返回值为true。然后,执行作为第二参数给出的函数。如果在使用第三个参数给出的时间段内(或默认为3秒)没有返回true值,则该函数将退出并显示'waitFor()' timeout的日志消息。

你只提供了一个参数;一个没有返回值的函数(基本上是page.includeJs())。因此,waitFor()应在3秒后退出timeout消息。

你真正想要实现的是

  • 等待正在加载的页面
  • 然后注入jQuery脚本,并等待,
  • 然后重新评估,并等待,
  • 然后提取信息

这是四个异步任务。 PhantomJS规定的基本方法是进入前一个回调函数中的相应下一步,从而产生四个嵌套回调。

由于这不是一个很好的模式(通常称为回调地狱), Promise 模式已作为Javascript功能引入(或包含在几个库中)

要了解如何将回调API重新制定为Promises,请查看 How do I convert an existing callback API to promises?