使用javascript的Python Webscrape网站

时间:2017-09-07 18:30:54

标签: javascript python-3.x web-scraping beautifulsoup

这段代码曾经适合我。

from bs4 import BeautifulSoup
from urllib.request import urlopen

search = 'some_website'
BeautifulSoup(urlopen(search), "lxml")

但现在我收到以下错误。

HTTPError: HTTP Error 403: Forbidden

我无法做一个简单的请求,因为我需要抓取javascript信息。

hdr = {'User-Agent': 'Mozilla/5.0'}
req = Request(site,headers=hdr)
page = urlopen(req)
soup = BeautifulSoup(page)
print(soup)

我在汤中得到以下内容。

<noscript>Please enable JavaScript to view the page content.</noscript>

当我收到&#34; HTTP错误403:Forbidden&#34;时,如何从网页上获取JavaScript?错误?感谢您的帮助。

我正在使用python 3.如果您需要更多信息,请与我们联系。

1 个答案:

答案 0 :(得分:0)

QtWebKit在Qt 5.5上游被弃用,在5.6中被删除。

您可能想切换到PyQt5.QtWebEngineWidgets。 link