使用Node.js从网站中收集信息

时间:2019-06-16 10:39:06

标签: node.js web-scraping

我需要从以下网站抓取集装箱信息:https://www.msc.com/track-a-shipment

容器示例:MEDU3249577

我需要获取以下信息:

enter image description here

关于如何使用Node.js的任何想法

1 个答案:

答案 0 :(得分:0)

首先,您需要获取页面的HTML代码。这可以通过使用NodeJS内置的http / https模块或got之类的库来完成。完成此操作后,您可以通过使用例如jsdom创建虚拟dom来查询元素。

示例代码如下:

// Require modules
const got = require('got');
const { JSDOM } = require("jsdom");

// Fetch the information
(async () => {
    try {
        const response = await got('https://example.com');
        const dom = new JSDOM(response.body);
        console.log(dom.window.document.querySelector("p").textContent);
    } catch (error) {
        console.log(error.response.body);
    }
})();