我需要从以下网站抓取集装箱信息:https://www.msc.com/track-a-shipment。
容器示例:MEDU3249577
我需要获取以下信息:
关于如何使用Node.js的任何想法
答案 0 :(得分:0)
首先,您需要获取页面的HTML代码。这可以通过使用NodeJS内置的http
/ https
模块或got
之类的库来完成。完成此操作后,您可以通过使用例如jsdom
创建虚拟dom来查询元素。
示例代码如下:
// Require modules
const got = require('got');
const { JSDOM } = require("jsdom");
// Fetch the information
(async () => {
try {
const response = await got('https://example.com');
const dom = new JSDOM(response.body);
console.log(dom.window.document.querySelector("p").textContent);
} catch (error) {
console.log(error.response.body);
}
})();