如何使用python下载网页并导出为PDF

时间:2012-03-23 18:56:21

标签: python pdf

我试图找出如何给python一个url列表并让它为该url创建一个pdf。因此,问题的第一步/第一部分是(如何吸收包括图像在内的所有内容等)。第2步将是如何将该内容推送到PDF格式。我可以弄清楚第3步是加入pdfs。

我发现了这个:http://svn.python.org/view/*checkout*/python/trunk/Tools/webchecker/websucker.py?content-type=text%2Fplain但不知道它是否有助于解决方案。

另外,我知道urllib,但它没有得到我希望在pdf中拥有的图像/等。

谢谢:)

如果想到一个应用程序会有所帮助,请说我有一个装满烹饪食谱书签的文件夹,我想用它制作个人食谱。有点儿我想要的。

1 个答案:

答案 0 :(得分:3)

如果您不需要链接为“实时”,您可以使用khtml2png(linux)或webkit2png(mac)获取所有感兴趣网页的“快照”,尽管您将以这种方式获取网站的图像..然后PIL可以将图像转换为PDF。