应用错误收集

我正在尝试在Django中创建一个应用程序，它接受用户输入并通过抓取一个站点来获取一个数字列表。现在获取列表中的每个数字，还有5个站点被抓取以获得更多数据。< / p>

现在我正在使用BeautifulSoup和urllib2的组合来操作页面源。但urllib2.urlopen()需要相当长的时间，而且由于我的应用程序从大量链接中获取页面源，因此即使在多线程（使用ThreadPool）之后，整个过程也会延迟。有没有办法让我的应用程序更有效？或urllib2的任何其他替代方案，可以减少处理时间？请帮帮我！提前致谢。

在Python中读取页面源的最快方法

0 个答案: