我用漂亮的汤来刮网站。它有我想要总结的数据页面。然而,每页一页一页地进行,每页大约需要2秒钟,因此我需要几乎一天才能完成我想要的数千页。很多时候只是等待url请求,所以我想我可以通过分离任务并一次运行一百个python脚本来做到这一点。但是有没有办法在一个python脚本中做到这一点?
答案 0 :(得分:1)
您可以使用multithreading.Pool运行多个线程,但除非您有超级计算机,否则可能不会有数百个线程。运行代码的计算机上的逻辑处理器数量可能是要使用的最佳线程数。 但是,有两件事需要考虑: