标签: java html pdf aspose
我在我的项目中使用poppler进行pdf到html的转换。是否有任何其他第三方插件可以将给定的PDF文档转换为HTML并提高转换质量?我们可以使用apose.PDF java库实现pdf到html的转换吗?
答案 0 :(得分:2)
查看JPedal,它可以将PDF转换为HTML。我最近不得不将它用于另一个用例,结果非常好。它可以很好地处理嵌入字体。不幸的是它不是免费的。
另一个很棒的(免费)PDF库是IcePDF,它是免费的,但它只能提取文本/图像或将PDF渲染成图像,但结果非常漂亮。
答案 1 :(得分:1)
结帐pdfBox 如果你想要一个开源的话。它提供了很好的提取工具。我构建用于提取文本和图像,直到现在,并且工作得很好。