bbox在这个脚本中引用了什么?

时间:2013-03-28 14:52:31

标签: python pdf pdfrw

我是Python新手,正在尝试掌握现有脚本。这个例子是从pdfrw给出的,如下所示:http://code.google.com/p/pdfrw/wiki/ExampleTools

“带有花哨的打印机和/或Acrobat的完整副本的打印机可以轻松地将您的小PDF变成小册子(例如,在单个11”x 17“上打印4个字母大小的页面)。

但这假设了几件事,包括人员知道如何操作硬件和软件。 booklet.py允许您将PDF转换为预先格式化的小册子,以减少混乱的可能性:“

我最好能说出步骤是:

  • 该功能开始循环遍历页面
  • 变量“shift_right”被声明为??? (我认为是元数据?)
  • 声明了一个仅对元数据有用的变量“stuff”(我认为)
  • x增加了BBox列表的第三个索引(此列表是什么,何时建立?)
  • y被分配给y和Bbox列表的第三个索引之间的较大值(同样,这个列表引用了什么?)

我认为我的核心混淆是关于BBox的这两行,以及它们如何互动以创建一个11x17的小册子PDF。感谢任何能够解决此问题的人。

    import sys
    import os

    import find_pdfrw
    from pdfrw import PdfReader, PdfWriter, PdfDict, PdfArray, PdfName, IndirectPdfDict
    from pdfrw.buildxobj import pagexobj
def fixpage(*pages):
    pages = [pagexobj(x) for x in pages]

    class PageStuff(tuple):
        pass

    x = y = 0
    for i, page in enumerate(pages):
        index = '/P%s' % i
        shift_right = x and '1 0 0 1 %s 0 cm ' % x or ''
        stuff = PageStuff((index, page))
        stuff.stream = 'q %s%s Do Q\n' % (shift_right, index)
        x += page.BBox[2]
        y = max(y, page.BBox[3])
        pages[i] = stuff

    # Multiple copies of first page used as a placeholder to
    # get blank page on back.
    for p1, p2 in zip(pages, pages[1:]):
        if p1[1] is p2[1]:
            pages.remove(p1)

    return IndirectPdfDict(
        Type = PdfName.Page,
        Contents = PdfDict(stream=''.join(page.stream for page in pages)),
        MediaBox = PdfArray([0, 0, x, y]),
        Resources = PdfDict(
            XObject = PdfDict(pages),
        ),
    )

inpfn, = sys.argv[1:]
outfn = 'booklet.' + os.path.basename(inpfn)
pages = PdfReader(inpfn).pages

# Use page1 as a marker to print a blank at the end
if len(pages) & 1:
    pages.append(pages[0])

bigpages = []
while len(pages) > 2:
    bigpages.append(fixpage(pages.pop(), pages.pop(0)))
    bigpages.append(fixpage(pages.pop(0), pages.pop()))

bigpages += pages

PdfWriter().addpages(bigpages).write(outfn)

1 个答案:

答案 0 :(得分:4)

Bbox通常是“边界框”的简写:在这种情况下,矩形定义了页面的尺寸。在这种情况下,它看起来像是一个包含4个数字的数组,前两个是页面的左上角(0,0),第三个是页面右侧的x-coordingate (因为左边是0,也是宽度),第四个是页面的底部/高度。