在Java中合并HTML文件

时间:2012-02-04 10:30:14

标签: java html

我想将多个HTML文件合并为一个。例如,如果我有两个分别打印WELCOMEXYZ的HTML文件,我可以将这两个文件合并为一个可以同时显示WELCOME XYZ的文件吗?这些操作我想做多个,假设有1500个文件。

感谢任何帮助。

3 个答案:

答案 0 :(得分:3)

您可以使用HTML解析/操作API,例如JSoup

答案 1 :(得分:1)

使用以下命令创建一个html文件并继续包含多个文件...

<!--#include virtual="insertthisfile1.html" -->
<!--#include virtual="insertthisfile2.html" -->
<!--#include virtual="insertthisfile3.html" -->
<!--#include virtual="insertthisfile4.html" -->

答案 2 :(得分:-1)

您可以通过迭代所有文件并以编程方式将<body>...</body>标记的内容附加在一起来完成此操作。

  1. 将所有html文件名转换为ArrayList<String>
  2. 创建一个StringBuilder
  3. 逐行阅读每个HTML文件,直到找到带有正文标记的行
  4. 从该标签开始读取,直到找到关闭正文标记的行
  5. 将此内容附加到StringBuilder
  6. 读取所有文件后,将StringBuilder内容写入一个文件。
  7. 最后,您将拥有一个HTML文件