如果我在python中有url,如何获取网页的HTML

时间:2014-04-29 20:45:06

标签: python file url

所以,让我们说我有这个网址:https://www.python.org/ 我想将页面的源代码下载到名为python_source.txt的.txt文件中

我该怎么做?

2 个答案:

答案 0 :(得分:2)

使用urllib2,以下是它的完成方式:

response = urllib2.urlopen(url)
content = response.read()

现在您可以将内容保存在任何文本文件中。

答案 1 :(得分:0)

python包urllib就是这样做的。文档提供了一个非常明确的示例,说明您想要做什么。

import urllib.request
local_filename, headers = urllib.request.urlretrieve('http://python.org/')
html = open(local_filename)