BeautifulSoup Webscraping空结果

时间:2019-05-19 17:57:17

标签: python-3.x web-scraping beautifulsoup

我正在尝试使用BeautifulSoup通过IShares网站检索ETF上的信息。但是,当我尝试在表上调用.sql函数时,会得到一个soup.find类型的对象。

我试图使用Web检查器来查找元素,但是我被卡住了。例如,我需要提取下表中的每个代码,名称和扇区:

https://www.ishares.com/uk/individual/en/products/etf-product-list?switchLocale=y&siteEntryPassthrough=true#!type=emeaIshares&tab=overview&view=list

如果您有任何帮助/建议,我将不胜感激。我是这个社区的新手,我刚刚开始使用BeautifulSoup,这是我的第一个网络抓取项目。

谢谢

None
  

出[13]:是

如果该函数运行正常,我本来希望获得属性列表(href,即代码),但在这种情况下似乎为空。

1 个答案:

答案 0 :(得分:0)

您可以使用内容的url页面获取所有信息的json

import requests
import json

r = requests.get('https://www.ishares.com/uk/individual/en/products/etf-product-list/1524727817681.ajax?fileType=json')
s = json.loads(r.text.strip('\ufeff'))
print(s)