坏:将pdf转换为图像

时间:2018-12-14 22:50:07

标签: pdf pdfbox

转换班级:

  public void getImage(String pdfFilename) throws Exception{

        List<byte[]> listImg = new ArrayList<>();
        try (final PDDocument document = PDDocument.load(new File(pdfFilename))){
            PDFRenderer pdfRenderer = new PDFRenderer(document);
            for (int page = 0; page < document.getNumberOfPages(); ++page)
            {
                File file = new File("C:\\path1\\"+page+".png");

                BufferedImage bim = pdfRenderer.renderImage(page);
                ByteArrayOutputStream baos = new ByteArrayOutputStream();
                ImageIO.write(bim, "png",file);


                System.out.println("!!!!");
              //  System.out.println(Arrays.toString(listImg.get(page)));



            }
            document.close();
        } catch (IOException e){
            System.err.println("Exception while trying to create pdf document - " + e);
        }

    }

一切正常。所有pdf文件都已转换,但是如果我使用了shw类(这对于我的项目是非常必要的):

 PdfDocument srcDoc = new PdfDocument(new PdfReader(DEST1));
        Rectangle rect = srcDoc.getFirstPage().getPageSize();
        System.out.println(rect);
        Rectangle pageSize = new Rectangle(rect.getWidth(), rect.getHeight());

        PdfDocument pdfDoc = new PdfDocument(new PdfWriter(dest));
        pdfDoc.setDefaultPageSize(new PageSize(pageSize));
        System.out.println(srcDoc.getNumberOfPages());
        PdfCanvas content = new PdfCanvas(pdfDoc.addNewPage());

        int n = 0;
        for (int i =1 ; i <= srcDoc.getNumberOfPages(); i++) {

            PdfFormXObject page = srcDoc.getPage(i).copyAsFormXObject(pdfDoc);
            content.clip();
            content.newPath();


               content.addXObject(page,MainPdf.right_Margin-MainPdf.left_Margin,0);
           content = new PdfCanvas(pdfDoc.addNewPage());

                for (double y = 4.251969f; y <= 595; y += 14.1732) {
                    content.moveTo(0, y);
                    content.lineTo(420, y);
                }
                for (double x = 0; x <= 420; x += 14.1732) {
                    content.moveTo(x, 0);
                    content.lineTo(x, 595);
                }
                content.closePathStroke();


        }

        srcDoc.close();
        pdfDoc.close();
    }

那些已被转换为空的图像(内部不包含任何内容,只有白色背景)。 PDF不为空。 pdf:https://dropmefiles.com/UXedd

[enter image description here 图片:

  

enter image description here

1 个答案:

答案 0 :(得分:3)

原因是电话

content.clip();
在itext段中的

。这将以空路径进行剪辑。 Adobe Reader会忽略这一点,但PDFBox不会,因此当前的剪切路径为空,因此看不到任何内容。

根据评论之一,删除该呼叫即可解决问题。 (我怀疑也不需要content.newPath();

我还尝试了其他查看器:PDF.js和GhostScript不显示它,Chrome和Edge显示它。