我试图从此网页获取内容" http://www.fibalivestats.com/u/ACBS/333409/pbp.html"使用此代码:
r = requests.get("http://www.fibalivestats.com/u/ACBS/333409/pbp.html")
if r.status_code != 200:
print("Error!!!")
html = r.content
soup = BeautifulSoup(html, "html.parser")
print(soup)
我得到了页面的模板,但没有得到与每个标签相关的数据。
我如何获取数据?我是Python的新手。
答案 0 :(得分:2)
在这种情况下,你没有触发Javascript,因此它没有填充元素。我建议你使用像Selenium这样的网络驱动程序,如here中所示。
它将模仿浏览器并执行Javascript。以下是一个例子。
from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://www.fibalivestats.com/u/ACBS/333409/pbp.html")
html_source = browser.page_source
soup = BeautifulSoup(html_source, "html.parser")