读取大于RAM的pdf部分? iText或其他图书馆

时间:2015-10-08 16:39:04

标签: java performance pdf memory itext

我有一个15gb大小的pdf,我打算用iText库读取它,当我的代码读取类PdfReader时,等待时间约为5分钟,以获取对象PdfReader。这比我想要的慢。

  1. 执行此代码时,我需要等待大约五分钟。
  2. PdfReader reader = new PdfReader(new RandomAccessFileOrArray(filename), null);

    1. 接下来,如果我有de PdfReader对象,我可以非常快地获得任何页面。
    2. Document document = new Document(); PdfCopy copy = new PdfCopy(document, new FileOutputStream("result.pdf")); document.open(); for (int i = 2400000; i <= 2400010; i++) {     copy.addPage(copy.getImportedPage(reader, i)); } document.close();

      有没有办法更有效地读取PDF文件?我认为只能读取外部参照表并在文件系统中写入,然后读取这些字节并在PdfReader中进行转换,但我不知道是否可行。

      更一般地说,是否有一个库可以有效地处理不适合RAM的PDF?

0 个答案:

没有答案