Google AppEngine上的HTML到PDF

时间:2018-04-16 13:59:26

标签: python-2.7 google-app-engine html2pdf

我们目前正在尝试使用Python在AppEngine上将html文件转换为PDF。 HTML文件来自第三方供应商,因此我们无法控制其格式。灵活环境和标准环境都是选项,但是我们走下去的每条道路似乎都遇到了障碍:

  • PDFkit 需要安装wkhtml2pdf,没有可用的PIP包,但转换完全离线
  • xhtml2pdf / PISA - 甚至可以在GAE Standard上运行,但不支持许多功能,例如浮动和格式错误的HTML
  • WeasyPrint - 理论上的C依赖关系将在Flexible环境中运行,但没有可用于依赖关系的pip包,包括Cairo和Pango

有没有人在AppEngine上运行以上任何一个强大的解决方案?或者我错过了其他图书馆?

1 个答案:

答案 0 :(得分:1)

我在一年前遇到了同样的问题并得出结论,这在App Engine中是不可能的,至少在质量转换方面是这样。 (如果事情发生了变化,有人请指出)

xhtml2pdf - 我能够在标准App Engine中成功运行它,但对转换质量一点都不满意。

PDFkit - 遇到类似问题并提出了不同的解决方案。在计算引擎实例上托管PDFkit并公开端点,其中带有HTML文件的POST请求将返回转换后的PDF作为响应。这给了我在加工质量/速度方面的最佳/预期结果。

它确实产生了一些额外的费用,但我也可以将该实例用于其他内容;)。我最初选择的配置最少,因为我没有在计算引擎实例上存储任何内容。