应用错误收集

使用python 2.5.2收集网页源代码

时间：2014-03-20 14:09:55

标签： python web-scraping python-2.5

我正在使用旧版python (2.5.2)。

处理设备

我正在编写一个需要阅读网页的脚本，但我无法访问普通的库 - urllib，urllib2和请求不可用。

过去人们是如何收集这个的？

我可以从wget/curl执行shell，但如果可能，我更愿意坚持使用python。我还需要能够通过代理，这可能会迫使我进入系统调用。

1 个答案:

答案 0 :(得分：1)

如果你真的想在Python中完成旧学但没有urllib，那么你将不得不使用套接字并实现HTTP 1.0的一小部分来获取页面。跳过篮球通过代理将会非常痛苦。

使用wget或curl并节省几天的调试时间。