PyPDF模块没有生成有效的pdf文件

时间:2016-06-18 12:16:17

标签: python file pdf pypdf2

我正在尝试在python中制作一些程序来操纵我的pdf beamer演示文稿。教授使用点击动态转换,因此一个页面有几个点击过渡。我想打印这些演示文稿,但我有大约5000页。所以我想只使用最后一次点击转换页面,所以我将页面数量减少到大约500.我正在使用PyPDF2模块,但它没有生成有效的pdf文件。这是代码:

from pyPdf import PdfFileWriter, PdfFileReader
import os,sys

pdful = raw_input("Uneti ime fajla:")
output = PdfFileWriter()
input1 = PdfFileReader(open(pdful, "rb"))

m = []
f = True
print ("Uneti strane koje zelite da zadrzite.String 0 kraj unosa:\n")

while f:
   l = int(raw_input("Uneti broj stranice:"))
   if l == 0:
      f = not f
   else: m.append(l-1)

for i in range(len(m)):
    strana  = input1.getPage(int(m[i]))

    output.addPage(strana)

outputStream = file("Mat8.pdf","wb")
output.write(outputStream)
# string writings are in Serbian, but that's not so important. Program should take input from user: name of file to manipulate, and pages that should copy.

1 个答案:

答案 0 :(得分:0)

from pyPdf import PdfFileWriter, PdfFileReader pyPdf已经停止,并由PyPDF2继承。我不确定Python 2,但在Python 3中你应该import PyPDF2

  1. 无需import os, sys。但是,如果您使用python3 xyz.py some_arg,则可以在bash中调用sys.argv。这样sys.argv[1] == some_arg
  2. 我更喜欢使用地图,只要您不需要逐行阅读输入。例如,

    print ("Uneti strane koje zelite da zadrzite.String 0 kraj unosa:\n")
    m = map (lambda x: int(x) - 1, raw_input("Uneti broj stranice:").split())
    
  3. 而不是while循环。此外,迭代对象而不是索引。

    for page_number in m:
        strana = input1.getPage(page_number)
        output.addPage(strana)
    
  4. 最后,使用with括起文件操作。 Python将自动处理文件的关闭,以免忘记这样做。

    with open (pdful, 'wb') as outputStream:
        output.write(outputStream)