使用proxies和urllib连接到网站?

时间:2011-08-11 20:24:41

标签: python urllib2 urllib

如果代理是200.217.241.76且端口是80,我如何连接到google.com并使用该代理读取html代码?

我的问题是建立连接我知道如何在我得到它时读取html文件, 我想自动化一个脚本,继续阅读不同的html文件并保存数据。

我现在拥有的:

import urllib
html = urllib.openurl("http://google.com").read()
# do stuff with html

一个例子会很棒!

1 个答案:

答案 0 :(得分:0)

urllib尊重系统代理设置:

  

urlopen()函数与没有代理的代理透明地工作   要求认证。在Unix或Windows环境中,设置   http_proxy或ftp_proxy环境变量到一个URL   在启动Python解释器之前标识代理服务器。   例如('%'是命令提示符):

> % http_proxy="http://www.someproxy.com:3128" 
> % export http_proxy 
> % python ...

enter link description here