我正在尝试从比赛网站上抓取数据,但抓取工具未返回任何结果

时间:2018-10-09 22:49:31

标签: python html selenium web-scraping

从硒导入网络驱动程序

driver = webdriver.Chrome()
login_url = 'http://www.attheraces.com/racecard/Wolverhampton/6-October-2018/1715'
driver.get(login_url)

html = driver.execute_script(“ return document.documentElement.outerHTML”)

sel_soup = BeautifulSoup(html, 'html.parser')
print(sel_soup.findAll("sectionals-time"))

当我运行脚本的最后一行时,它只会返回

[]

据我所知,这是一个动态的网站,因此,当您转到该网站并向下滚动到结果时,单击“分段时间”选项卡,然后右键单击第一个列出的马的第一个分段时间并进行检查。然后,这向我显示了类别属性为“分段时间”,因此我很难理解为什么它没有为马匹产生分段时间。

任何建议和帮助,不胜感激。

2 个答案:

答案 0 :(得分:0)

在我看来,您选择器有误, 您是否应该指定:

soup.findAll(“ span”,{“ class”:“ sections-time”})

希望有帮助

答案 1 :(得分:0)

这将起作用。如果您需要不同的输出,请发表评论。

cache