如何将html页面的内容转换为pdf

时间:2017-01-13 21:27:56

标签: java html spring-mvc pdf thymeleaf

我正在尝试获取或下载包含大量信息(表格..)的html页面内容到pdf文件中。 我尝试使用这段代码但是把信息作为html信息(带标签)。

:如何将此内容转换为pdf? 这是我的代码:

try{
    File file = new File("C:/Users/Hamza Amrani/Desktop/riad/testFile1.text");
    FileWriter writer_f = new FileWriter(file);
    URL url = new URL("http://localhost:8090/afficher?id=3");
      BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
      String line;

      while ((line = reader.readLine()) != null) {
         System.out.println(line);
         writer_f.write(line);
      }
      reader.close();
      writer_f.close();
    }
    catch (Exception e) {
        e.printStackTrace();
}

1 个答案:

答案 0 :(得分:-1)

首先你的问题不明确。如果你想用pdf写一个完整的html页面,那么从 URL 获取html内容的代码是正确的。但是要将这些内容写入pdf文件,您将需要iText,这是一个允许创建PDF,阅读PDF和操作它们的Java库。您可以按照本教程了解 iText

但是,如果您需要解析 HTML 页面,例如在<h1>标记内获取信息,则需要 HTML Parser jsoup是此问题的最佳解决方案。请点击此链接以更好地了解 jsoup

希望这能解决您的问题。