PDFBOX:将pdf转换为text或html,包括pdf中的图像

时间:2012-03-12 16:47:54

标签: java pdf pdfbox

我正在开发一个将pdf转换为html的移动应用程序。我找到了PDFBox,效果很好。我在一侧获得了PDF文本或HTML,其他图像。 但我想更进一步,我需要生成的HTML包含pdf中的图像。 可以用PDFBox完成吗?怎么样? 如果您知道另一个免费的库函数,请告诉我。

提前致谢。

1 个答案:

答案 0 :(得分:1)

查看ExtractImages.java - 这将指导您如何从PDF文件中提取图像。

接下来调查PrintImageLocations.java示例 - 您将需要这些位置来正确格式化HTML文件。