如何在Python中使用wkhtmltopdf自定义头和代理?

时间:2016-04-19 15:48:38

标签: python wkhtmltopdf pdfkit

我使用函数pdfkit.from_url将html转换为pdf。我想自定义http头和代理。我尝试了一些代码,但是我失败了。

我的代码正在关注。

#!/usr/bin/env python
# encoding: utf-8


import pdfkit
import requests

url = 'http://www.baidu.com'
headers = {'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/48.0.2564.82 Chrome/48.0.2564.82 Safari/537.36'}
proxy ={'http': '113.119.82.69:9000'}
options = {
        'custom-header':headers,
        'proxy': proxy
        }


pdfkit.from_url(url,'out.pdf',options=options)

1 个答案:

答案 0 :(得分:1)

cmd代码:

# wkhtmltopdf -p proxy target_website output.pdf
wkhtmltopdf -p socks5://192.168.1.100:1080 https://stackoverflow.com output.pdf

python代码:

import pdfkit

pdfkit.from_url(
    output_path='output.pdf',
    options={
        # proxy ?
        # http://user:password@myproxyserver:8080
        # '--proxy': 'socks5://192.168.1.100:1080',
        '--proxy': 'http://113.119.82.69:9000',
        # quiet ?
        # '--quiet': ''
    },
    url='https://stackoverflow.com',
)