如果代理是200.217.241.76
且端口是80
,我如何连接到google.com
并使用该代理读取html代码?
我的问题是建立连接我知道如何在我得到它时读取html文件, 我想自动化一个脚本,继续阅读不同的html文件并保存数据。
我现在拥有的:
import urllib
html = urllib.openurl("http://google.com").read()
# do stuff with html
一个例子会很棒!
答案 0 :(得分:0)
urllib尊重系统代理设置:
urlopen()函数与没有代理的代理透明地工作 要求认证。在Unix或Windows环境中,设置 http_proxy或ftp_proxy环境变量到一个URL 在启动Python解释器之前标识代理服务器。 例如('%'是命令提示符):
> % http_proxy="http://www.someproxy.com:3128"
> % export http_proxy
> % python ...