在内存中复制和编辑HTML

时间:2013-09-16 22:50:27

标签: java html io

我想阅读我指定的HTML文件,而不是编辑和保存文件,我想使用StringBuilder修改该数据并将其保存在内存中,以便我可以将它保存在别处或者做各种任务。

假设我想编辑一个格式相似的HTML文件:

<html>
     <body>
          <p>Data</p>
          <p>More data</p>
     </body>
</html>

我希望能够在最后一组数据“更多数据”之后输入信息,这意味着我希望在</p></body>标题之间输入。

我听说过许多HTML解析器和API,例如 HTML Agility Pack 。任何这些都是我想做的可行选择吗?

任何建议都很有用!

1 个答案:

答案 0 :(得分:1)

jsoup看起来会完成这项工作。但是,如果您只想在结束body标记之前插入内容,那么使用简单的正则表达式查找结束标记可能要容易得多。你甚至可以做到:

htmlString.indexOf("</body>")

在此之前添加你需要的任何东西。