如何使用python漂亮的汤来网页抓取仅在鼠标悬停时出现的数据?

时间:2019-10-19 16:55:46

标签: python web-scraping beautifulsoup

所以我正在研究一个项目,并且在这个链接上: https://www.nasdaq.com/market-activity/stocks/aapl/earnings

我可以通过普通的漂亮汤方法轻松地提取所有表格数据。但是,在站点上有一个图形,仅当您将光标悬停在该图形上时,我才需要该数据。我的问题很简单,您如何提取呢?因为当我在条形图上检查站点的源代码时,我只得到它的css部分,条形的长度以及所有长度,而不是鼠标悬停时出现的估计的和报告的EPS的实际数据。我希望我能



try:
        divparent = soup.find_all('div', attrs={'class':'highcharts-point highcharts-color-0     highcharts-point-mouseOut'})
except:
    print("no table div")
    return 

我尝试执行上面的代码,但无济于事,而且我真的不知道该如何处理。任何帮助,将不胜感激。谢谢。

1 个答案:

答案 0 :(得分:0)

此数据正在使用JavaScript添加到页面,并且不在您对https://www.nasdaq.com/market-activity/stocks/aapl/earnings的请求中得到的响应。

但是,您可以使用API​​来获得它(这是JavaScript代码所做的)。只需将您的获取请求发送至:https://api.nasdaq.com/api/quote/AAPL/eps