使用node.js聚合来自许多HTML文件的表数据

时间:2019-07-18 16:48:46

标签: html node.js html-table

我有大约400个本地HTML文件,所有HTML文件都包含一个HTML表。每个HTML表都由一个日期行和一个值行组成。所有HTML文件中的日期行都是相同的(值显然不同,并且它们也可能以不同的日期开始)。

将所有400个HTML文件合并为一个HTML文件的最简单,最安全的方法(这样就不会混淆任何值)是什么? node.js中的解决方案将是不错的选择。

对于我来说,听起来并不棘手,当我想到视觉效果时,只需附加值行即可。但是,当然,每个值都必须附加在HTML表中的td元素的末尾。第二个“问题”是将每个值分配给正确的日期。

我创建了一个fs.createWriteStream,并考虑了遍历所有400个HTML文件,并将特定日期的每个值写入数组或JSON对象。然后,完成后,生成这些数组的HTML表。我在这里停留是因为我认为可能会有更好,更轻松的解决方案。 我还使用过cheerio来加载本地HTML文件,但是我也不知道这是否是正确的方法。

'use strict';

const fs = require('fs');
const path = require('path');

const cheerio = require('cheerio');

const $ = cheerio.load(fs.readFileSync(__dirname + '/html/1.html'));

这里有2个示例(400个HTML表中的示例)以及结果的外观。

(1) enter image description here (2) enter image description here (结果) enter image description here

示例1的表数据:https://jsfiddle.net/h795xuLc/

示例2的表数据:https://jsfiddle.net/h795xuLc/2/

结果表数据:https://jsfiddle.net/h795xuLc/3/

0 个答案:

没有答案