现在让我先说我知道bs4,scrapy,selenium以及更多可以做到这一点,但这不是我想要的原因有很多。
我想要做的是打开一个webbrowser(chrome,即firefox),并在从Web浏览器的Web浏览器加载网站后从页面中提取html。
import webbrowser
import time
class ScreenCapture:
url = 'https://www.google.com/'
webbrowser.get("C:/Program Files (x86)/Google/Chrome/Application/chrome.exe %s").open(url)
# get html from browser that is open
答案 0 :(得分:-1)
没有必要用这个打扰webbrowser。如果您只想获取网站的HTML,只需使用urllib.request.urlopen。
from urllib.request import urlopen
with urlopen(url) as f:
html = f.read()
print(html)