自动化PDF生成

时间:2011-12-06 01:45:04

标签: python pdf adobe report acrobat

用于生成PDF报告的可靠工具是什么?特别是,我们有兴趣创建具有视频的交互式PDF,例如找到here的示例。

目前我们正在使用Python和reportlab来生成PDF,但还没有完全探索过这个库(主要是因为许可证定价有点过高)

我们一直在关注Adobe的SDKiText库,但很难说它们的功能是什么。

从模板PDF生成文档的能力将是一个优势。

任何指针或评论都将受到赞赏。

谢谢,

2 个答案:

答案 0 :(得分:5)

最近,我需要为Django应用程序创建PDF报告;有一个ReportLab许可证,但我最终选择了LaTeX。这种方法的好处是我们可以使用Django templates生成LaTeX源代码,而不是为我们需要创建的许多报告编写大量代码。另外,我们可以利用相对更简洁的LaTeX语法(确实有很多怪癖,并不适合各种用途)。

This snippet提供了该方法的一般概述。我发现有必要进行一些更改,我在本问题的最后提供了这些更改。主要的补充是Rerun LaTeX消息的检测,这表明需要额外的传递。用法很简单:

def my_view(request):
    pdf_stream = process_latex(
        'latex_template.tex',
        context=RequestContext(request, {'context_obj': context_obj})
    )
    return HttpResponse(pdf_stream, content_type='application/pdf')

可以在LaTeX生成的PDF中嵌入视频,但我没有任何使用它的经验。 Here是最高Google result

此解决方案确实需要生成一个新进程(pdflatex),因此如果您希望继续查找纯Python解决方案。

import os
from subprocess import Popen, PIPE
from tempfile import NamedTemporaryFile

from django.template import loader, Context


class LaTeXException(Exception):
    pass


def process_latex(template, context={}, type='pdf', outfile=None):
    """
    Processes a template as a LaTeX source file.
    Output is either being returned or stored in outfile.
    At the moment only pdf output is supported.
    """
    t = loader.get_template(template)
    c = Context(context)
    r = t.render(c)

    tex = NamedTemporaryFile()
    tex.write(r)
    tex.flush()
    base = tex.name
    names = dict((x, '%s.%s' % (base, x)) for x in (
        'log', 'aux', 'pdf', 'dvi', 'png'))
    output = names[type]

    stdout = None
    if type == 'pdf' or type == 'dvi':
        stdout = pdflatex(base, type)
    elif type == 'png':
        stdout = pdflatex(base, 'dvi')
        out, err = Popen(
            ['dvipng', '-bg', '-transparent', names['dvi'], '-o', names['png']],
            cwd=os.path.dirname(base), stdout=PIPE, stderr=PIPE
        ).communicate()

    os.remove(names['log'])
    os.remove(names['aux'])

    # pdflatex appears to ALWAYS return 1, never returning 0 on success, at
    # least on the version installed from the Ubuntu apt repository.
    # so instead of relying on the return code to determine if it failed,
    # check if it successfully created the pdf on disk.
    if not os.path.exists(output):
        details = '*** pdflatex output: ***\n%s\n*** LaTeX source: ***\n%s' % (
            stdout, r)
        raise LaTeXException(details)

    if not outfile:
        o = file(output).read()
        os.remove(output)
        return o
    else:
        os.rename(output, outfile)


def pdflatex(file, type='pdf'):
    out, err = Popen(
        ['pdflatex', '-interaction=nonstopmode', '-output-format', type, file],
        cwd=os.path.dirname(file), stdout=PIPE, stderr=PIPE
    ).communicate()

    # If the output tells us to rerun, do it by recursing over ourself.
    if 'Rerun LaTeX.' in out:
        return pdflatex(file, type)
    else:
        return out

答案 1 :(得分:0)

我建议使用https://github.com/mreiferson/py-wkhtmltox将HTML呈现为PDF。

使用您选择的任何工具将报告呈现为HTML。我喜欢http://www.makotemplates.org/