Python网页下载器

时间:2015-03-03 02:38:35

标签: python html sockets

嘿伙计们,我需要帮助。我绝望了。

使用基本套接字在Python中开发网页下载程序 编程,如课堂上所讨论的。程序接收指向基本HTML文件的URL 作为命令行参数,然后下载此基本文件以及其中的所有图像对象 文件。您只需要支持非持久连接。 回想一下,在所有类项目中,您必须使用基本的套接字编程来进行网络连接而不是 高级图书馆。 提示:您可以使用HTMLParser库来解析HTML文件并识别其中的所有图像。更多 有关此库的信息,请访问https://docs.python.org/2/library/htmlparser.html

1 个答案:

答案 0 :(得分:1)

这听起来像2个任务。当然,你不要指望我们听到了课堂上讨论的内容!"

  1. 使用套接字执行HTTP GET
  2. 解析HTML
  3. 独立完成工作。 完成后将它们粘在一起。