Question

我需要从以下网站抓取集装箱信息：https://www.msc.com/track-a-shipment。

容器示例：MEDU3249577

我需要获取以下信息：

关于如何使用Node.js的任何想法

Answer 1

首先，您需要获取页面的HTML代码。这可以通过使用NodeJS内置的http / https模块或got之类的库来完成。完成此操作后，您可以通过使用例如jsdom创建虚拟dom来查询元素。

示例代码如下：

// Require modules
const got = require('got');
const { JSDOM } = require("jsdom");

// Fetch the information
(async () => {
    try {
        const response = await got('https://example.com');
        const dom = new JSDOM(response.body);
        console.log(dom.window.document.querySelector("p").textContent);
    } catch (error) {
        console.log(error.response.body);
    }
})();

使用Node.js从网站中收集信息

1 个答案: