将PDF文件转换为单个HTML文件

时间:2012-01-30 08:45:33

标签: java html pdf pdf-to-html document-conversion

我正在尝试将PDF文档转换为java中的单个HTML文件。大多数转换器在线将一个PDF文件转换为多个HTML文件。我想将整个PDF转换为单个HTML文件。

有什么建议吗?

3 个答案:

答案 0 :(得分:3)

  

有什么建议吗?

您可能总是使用JSoup API编写一些代码来编写包含多个HTML文件中每个body的单个文档。结合风格和样式表(CSS)可能有点棘手(特别是如果原始HTML使用'id'元素)。


虽然我发现很难相信没有转换器,其中“单个文档”是一个选项。我建议进一步搜索。

答案 1 :(得分:0)

我认为应该可以使用itext解析PDF文档,然后生成html文件。 我必须承认我没有检查它是否可行。

答案 2 :(得分:0)

您是否查看了http://www.jpedal.org/html_index.php哪个选项可以写入单个文件。