阅读PDF文件并使用Java / Liferay将其再次保存为PDF

时间:2018-01-20 18:28:06

标签: java liferay liferay-6 portlet

有人可以给我一些想法来阅读PDF文件以使其可编辑,然后将其再次以PDF格式保存在Java中吗?这是否可以以一种相当简单的方式并且不使用像itext这样的库?它适用于Liferay 6.2项目。

非常感谢。

2 个答案:

答案 0 :(得分:1)

如何在Liferay中进行文档转换的一种非常方便的方法是使用开放式办公室集成。

DocumentConversionUtil.convert(
        String id, InputStream inputStream, String sourceExtension,
        String targetExtension)

请注意,这可能会破坏PDF UI,具体取决于。如果它只是文本你应该没事。

答案 1 :(得分:1)

我能够使用Apache PDFBox恢复PDF文件的文本。在maven项目pom.xml中,我们必须添加依赖

<dependency>
        <groupId>org.apache.pdfbox</groupId>
        <artifactId>pdfbox</artifactId>
        <version>2.0.8</version>
</dependency>

代码:

try {
        DLFileEntry fileEntry = DLFileEntryLocalServiceUtil.getFileEntry(folder.getGroupId(), folder.getFolderId(), fileName);
        File file = DLFileEntryLocalServiceUtil.getFile(themeDisplay.getUserId(), fileEntry.getFileEntryId(), fileEntry.getVersion(), true);
        PDDocument pddDocument=PDDocument.load(file);
        PDFTextStripper textStripper = new PDFTextStripper();
        String text = textStripper.getText(pddDocument);
    } catch (Exception e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

要创建PDF,请参阅文档:

https://pdfbox.apache.org/1.8/cookbook/documentcreation.html