Question

我正试图从this网站上抓取先前的收盘价和开盘价。这是一张图片，作为要抓取的信息所在位置的参考。

看起来特定的表是带有div的{{1}}标记的子表，但是bs4在所有尝试找到它的过程中仅返回class="col-lg-13"。

我尝试了以下操作：

None

我也尝试过：

from bs4 import BeautifulSoup
import requests

link = "https://bseindia.com/stock-share-price/bharat-gears-ltd/bharatgear/505688/"
resp = requests.get(link).content
soup = BeautifulSoup(resp, "lxml")

box = soup.find('div', class_="col-lg-13")
table = box.find('table')
print(table)

>>> None

Answer 1

使用页面用于数据的相同URL（API）。可以在“网络”标签中找到

import requests
r = requests.get('https://api.bseindia.com/BseIndiaAPI/api/getScripHeaderData/w?Debtflag=&scripcode=505688&seriesid=').json()
prev_close = r['Header']['PrevClose']
prev_open = r['Header']['Open']
print(prev_close, prev_open)

无法使用bs4从BSE网站上抓取特定信息

1 个答案: