我使用函数pdfkit.from_url
将html转换为pdf。我想自定义http头和代理。我尝试了一些代码,但是我失败了。
我的代码正在关注。
#!/usr/bin/env python
# encoding: utf-8
import pdfkit
import requests
url = 'http://www.baidu.com'
headers = {'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/48.0.2564.82 Chrome/48.0.2564.82 Safari/537.36'}
proxy ={'http': '113.119.82.69:9000'}
options = {
'custom-header':headers,
'proxy': proxy
}
pdfkit.from_url(url,'out.pdf',options=options)
答案 0 :(得分:1)
cmd代码:
# wkhtmltopdf -p proxy target_website output.pdf
wkhtmltopdf -p socks5://192.168.1.100:1080 https://stackoverflow.com output.pdf
python代码:
import pdfkit
pdfkit.from_url(
output_path='output.pdf',
options={
# proxy ?
# http://user:password@myproxyserver:8080
# '--proxy': 'socks5://192.168.1.100:1080',
'--proxy': 'http://113.119.82.69:9000',
# quiet ?
# '--quiet': ''
},
url='https://stackoverflow.com',
)