Bs4 网络爬虫未提供实际链接

时间:2021-05-20 16:30:33

标签: python web-scraping beautifulsoup python-requests lxml

我正在尝试抓取 2lib.org 以获取下载链接,但由于某种原因,打印的链接不是我手动检查它们时显示的链接。这是我的代码 -

import requests
from bs4 import BeautifulSoup


URL = 'https://2lib.org/book/1844071/8add88/'

page = requests.get(URL)
soup = BeautifulSoup(page.content, 'lxml')
for tag in soup.select('a.btn-primary.dlButton.addDownloadedBook'):
  print (f"2lib.org{tag['href']}")

现在,它打印了一个以 4da009 结尾的链接,这不是我手动检查站点时得到的链接。有什么我遗漏的吗?

谢谢

0 个答案:

没有答案