我正在尝试使用BeautifulSoup通过IShares网站检索ETF上的信息。但是,当我尝试在表上调用.sql
函数时,会得到一个soup.find
类型的对象。
我试图使用Web检查器来查找元素,但是我被卡住了。例如,我需要提取下表中的每个代码,名称和扇区:
如果您有任何帮助/建议,我将不胜感激。我是这个社区的新手,我刚刚开始使用BeautifulSoup,这是我的第一个网络抓取项目。
谢谢
None
出[13]:是
如果该函数运行正常,我本来希望获得属性列表(href,即代码),但在这种情况下似乎为空。
答案 0 :(得分:0)
您可以使用内容的url页面获取所有信息的json
import requests
import json
r = requests.get('https://www.ishares.com/uk/individual/en/products/etf-product-list/1524727817681.ajax?fileType=json')
s = json.loads(r.text.strip('\ufeff'))
print(s)