使用python 2.5.2收集网页源代码

时间:2014-03-20 14:09:55

标签: python web-scraping python-2.5

我正在使用旧版python (2.5.2)

处理设备

我正在编写一个需要阅读网页的脚本,但我无法访问普通的库   - urlliburllib2和请求不可用。

过去人们是如何收集这个的?

我可以从wget/curl执行shell,但如果可能,我更愿意坚持使用python。我还需要能够通过代理,这可能会迫使我进入系统调用。

1 个答案:

答案 0 :(得分:1)

如果你真的想在Python中完成旧学但没有urllib,那么你将不得不使用套接字并实现HTTP 1.0的一小部分来获取页面。跳过篮球通过代理将会非常痛苦。

使用wget或curl并节省几天的调试时间。