在网站上通过迭代进行抓取时重定向KeyError

时间:2018-11-28 01:08:42

标签: python python-3.x loops web-scraping screen-scraping

我正在尝试抓取CSV文件列中包含的网站时进行抓取。

问题是我得到了: KeyError :“ http://www.onisep.fr/http/redirection/metier/identifiant/10164” 重定向到我感兴趣的链接之一。

这是我的代码:

for row in file:
    my_list = []
    dat_link = row['onisep link']
    requete = requests.get(row["{}".format(dat_link)])
    page = requete.content
    soup = BeautifulSoup(page)
    my_list.append(soup.find_all("span", "ezstring-field")[2].text.strip()) 
return my_list

我已经进行了一些研究并尝试了time.sleep,但这并不能解决我的问题。关于如何消除该错误的任何想法吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

dat_link是字符串URL,不是密钥,请直接使用。

dat_link = row['onisep link']
requete = requests.get(dat_link)