python打开webbrowser并获取HTML

时间:2018-04-26 15:20:38

标签: python python-3.x

现在让我先说我知道bs4,scrapy,selenium以及更多可以做到这一点,但这不是我想要的原因有很多。

我想要做的是打开一个webbrowser(chrome,即firefox),并在从Web浏览器的Web浏览器加载网站后从页面中提取html。

import webbrowser
import time


class ScreenCapture:
    url = 'https://www.google.com/'
    webbrowser.get("C:/Program Files (x86)/Google/Chrome/Application/chrome.exe %s").open(url)

    # get html from browser that is open

1 个答案:

答案 0 :(得分:-1)

没有必要用这个打扰webbrowser。如果您只想获取网站的HTML,只需使用urllib.request.urlopen

from urllib.request import urlopen
with urlopen(url) as f:
   html = f.read()
print(html)