这段代码曾经适合我。
from bs4 import BeautifulSoup
from urllib.request import urlopen
search = 'some_website'
BeautifulSoup(urlopen(search), "lxml")
但现在我收到以下错误。
HTTPError: HTTP Error 403: Forbidden
我无法做一个简单的请求,因为我需要抓取javascript信息。
hdr = {'User-Agent': 'Mozilla/5.0'}
req = Request(site,headers=hdr)
page = urlopen(req)
soup = BeautifulSoup(page)
print(soup)
我在汤中得到以下内容。
<noscript>Please enable JavaScript to view the page content.</noscript>
当我收到&#34; HTTP错误403:Forbidden&#34;时,如何从网页上获取JavaScript?错误?感谢您的帮助。
我正在使用python 3.如果您需要更多信息,请与我们联系。