我正在尝试将PDF文档转换为java中的单个HTML文件。大多数转换器在线将一个PDF文件转换为多个HTML文件。我想将整个PDF转换为单个HTML文件。
有什么建议吗?
答案 0 :(得分:3)
有什么建议吗?
您可能总是使用JSoup API编写一些代码来编写包含多个HTML文件中每个body
的单个文档。结合风格和样式表(CSS)可能有点棘手(特别是如果原始HTML使用'id'元素)。
虽然我发现很难相信没有转换器,其中“单个文档”是一个选项。我建议进一步搜索。
答案 1 :(得分:0)
我认为应该可以使用itext解析PDF文档,然后生成html文件。 我必须承认我没有检查它是否可行。
答案 2 :(得分:0)
您是否查看了http://www.jpedal.org/html_index.php哪个选项可以写入单个文件。