使用python

时间:2016-07-17 06:19:18

标签: python beautifulsoup

我设计了一个python程序,它将打开一个url并从该url获取电子邮件和数字等数据。 主要问题是它很慢,我想知道是否有办法提高从url获取数据的速度。

一些规格:

  1. 程序在python中。
  2. 我正在使用urllib2.open打开网址
  3. beautifulsoup for search and fetching
  4.   

    opener = urllib2.build_opener()   opener.addheaders = [(' User-agent',' Mozilla / 5.0')]

    with open('Labgodata.csv') as csvfile:
            reader = csv.DictReader(csvfile)
            for line in reader:
                sleep(0.2)
                getdata(line['URL'])
    

1 个答案:

答案 0 :(得分:0)

你现在在做什么?没有看到你的程序到底做了什么,很难准确说出来。

一般情况下,尝试限制对网址的调用,如果从网页中获取大量数据会尝试同时抓取您需要的所有内容并将其保存到变量中,那么如果您进行多次调用则需要更少的时间从内存中获取它然后发出网页请求。