在for循环中,为什​​么i ++在第二次使用后会变为1?

时间:2015-03-16 14:18:56

标签: javascript jquery web-scraping

为什么for循环中的var i从0变为1?

这一行:for for(var i = 0; i< siteDatabase.length; i ++)在第一个循环中增加0到1?然后导致siteDatabase [i]访问索引1而不是0的元素。我认为i ++在第二个循环上递增?

结果是通过方法调用(推送)到未定义元素的错误。

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');
for (var i = 0; i < siteDatabase.length; i++) {
    news[siteDatabase[i]] = [];

    scraperjs.StaticScraper.create(siteDatabase[i])
        .scrape(function($) {
            return $(".lang_English").map(function() {
                return $(this).children('td').eq(1).children(
                    'a').last().text();
            }).get();
        }, function(news) {
            for (var x = 0; x < news.length; x++) {
                if (news[x] == '') {
                    news.splice(x, 1);
                }
            }
            for (var x = 0; x < news.length; x++) {
                // i in siteDatabase[i] is not 0, but 1??
                newsUpdates[siteDatabase[i]].push({
                    "title": news[x]
                });
                // TypeError: Cannot call method 'push' of undefined
            }
            console.log(newsUpdates);
        })
}

问题在于我在代码之间发表评论的区域。

2 个答案:

答案 0 :(得分:4)

您传入.scrape的功能对i变量有持久引用,而不是创建函数时的副本。{所以当函数运行时,它会使用i的值,这可能是(大概)在循环结束之后,当i的值有改变。

在这种情况下,我可能会使用构建器函数来构建回调,以便回调关闭不会发生变化的内容:

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');
for (var i = 0; i < siteDatabase.length; i++) {
    news[siteDatabase[i]] = [];

    scraperjs.StaticScraper.create(siteDatabase[i])
        .scrape(function($) {
            return $(".lang_English").map(function() {
                return $(this).children('td').eq(1).children(
                    'a').last().text();
            }).get();
        }, buildCallback(i))
}

function buildCallback(index) {
    return function(news) {
        for (var x = 0; x < news.length; x++) {
            if (news[x] == '') {
                news.splice(x, 1);
            }
        }
        for (var x = 0; x < news.length; x++) {
            newsUpdates[siteDatabase[inindex]].push({
                "title": news[x]
            });
        }
        console.log(newsUpdates);
    };
}

在那里,我们从buildCallback返回的函数关闭index参数,其值永远不会改变。然后我们将i传递给它,以构建我们的回调。

答案 1 :(得分:0)

由于siteDatabase似乎是一个数组,解决此问题的另一种方法是使用siteDatabase.forEach,这将为每次迭代提供一个单独的闭包变量。我更喜欢这种构建器函数方法,因为它更直接,更容易理解:

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');

siteDatabase.forEach(function (site) {
    scraperjs.StaticScraper.create(site)
    .scrape(function($) {
        return $(".lang_English").map(function() {
            return $(this).children('td').eq(1)
                          .children('a').last().text();
        }).get();
    }, function(news) {
        newsUpdates[site] = news.filter(function (item) {
            return item != '';
        }).map(function (item) {
            return { title: item };
        });
        console.log(newsUpdates);
    });
});

你可以进一步将其分解为功能,使其更清晰,更具表现力:

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');

function scrapePageNewsItems($) {
    return $(".lang_English").map(function() {
        return $(this).children('td').eq(1)
                      .children('a').last().text();
    }).get();
}

function notBlank(item) {
    return item != '';
}

function convertNewsItem(item) {
    return { title: item };
}

function convertNewsItems(news) {
    return news.filter(notBlank).map(convertNewsItem);
}

siteDatabase.forEach(function (site) {
    scraperjs.StaticScraper.create(site)
    .scrape(scrapePageNewsItems, function(news) {
        newsUpdates[site] = convertNewsItems(news);
        console.log(newsUpdates);
    });
});