刮刮啦啦 - 获得唯一元素[k]

时间:2016-12-19 10:32:20

标签: javascript jquery web-scraping cheerio

问题:使用这段代码,我得到一个给定元素的每次迭代的列表(这里是h1)

我想得到这个元素的数字k(k可以是变量假设)。

最后,我想说,element1 [i],element2 [j],其中element1可以是一个类,id,对于element2是相同的

然后在一个JSON文件中连接element1,2,... n

我认为这是一个非常基本的问题,但我对jQuery很新...

'use strict';

var url = "http://www.website.html",
rech = "h1";

// Import the dependencies
var cheerio = require("cheerio"),
req = require("tinyreq");

// Define the scrape function
function scrape(url, data, cb) {
// 1. Create the request
req(url, (err, body) => {
    if (err) { return cb(err); }

    // 2. Parse the HTML
    let $ = cheerio.load(body)
      , pageData = {}
      ;

    // 3. Extract the data
    Object.keys(data).forEach(k => {
        pageData[k] = $(data[k]).text();
    });

    // Send the data in the callback
    cb(null, pageData);
});
}

// Extract some data from my website
scrape(url, {

rech

}, (err, data) => {
console.log(err || data);
});

0 个答案:

没有答案