为什么PDFBox在转换为图像文件时会删除矩形线

时间:2013-02-13 18:19:53

标签: java pdf pdfbox

broken converted image 我尝试将pdf转换为图像文件....它工作正常,但它删除了一个矩形中的一条线....我无法弄清楚为什么...... ..

public static void main(String[] args) throws FileNotFoundException, IOException
    {
        PDDocument doc = PDDocument.load(new FileInputStream(new File(".....pdf")));

    PDDocumentCatalog docCatalog = doc.getDocumentCatalog();
    List pages = docCatalog.getAllPages();

    for (Object pageObj : pages)
    {
        PDPage page = (PDPage) pageObj;
        BufferedImage pdfImage = page.convertToImage();
        ImageIO.write(pdfImage, "png", new File("/......png"));

    }
    doc.close();
}

在我删除pdf的所有文本之前....可能是因为它还在讨论文本宽度之一,然后覆盖矩形线? Plse在这里看pdf ...... origin PDF

1 个答案:

答案 0 :(得分:1)

当尝试重现该问题时,结果表明当前的PDFBox 1.7.1正确呈现image。仅在使用旧版本0.7.3时才会出现此问题。

因此,如果使用Maven,请使用

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>1.7.1</version>
</dependency>

或出现此类问题的较新版本。