在Python中读取页面源的最快方法

时间:2013-12-30 00:05:34

标签: python django urllib2

我正在尝试在Django中创建一个应用程序,它接受用户输入并通过抓取一个站点来获取一个数字列表。现在获取列表中的每个数字,还有5个站点被抓取以获得更多数据。< / p>

现在我正在使用BeautifulSoup和urllib2的组合来操作页面源。但urllib2.urlopen()需要相当长的时间,而且由于我的应用程序从大量链接中获取页面源,因此即使在多线程(使用ThreadPool)之后,整个过程也会延迟。有没有办法让我的应用程序更有效?或urllib2的任何其他替代方案,可以减少处理时间?请帮帮我!提前致谢。

0 个答案:

没有答案