我需要在后台打开一个网站,加载几秒钟后,下载页面上的所有内容。
我可以打开页面,
import webbrowser
import string
url = 'www.face.com'
webbrowser.open(url)
但是这会打开webbrowser,而我不需要显示该网站实际上是打开的。我想我可以用wget下载页面。
答案 0 :(得分:1)
如果您需要欺骗人类使用硒访问的网页。但请注意,您可以使用各种HTTP客户端下载内容(在这种情况下,您将不会获得任何动态加载的内容)。
Python有一个内置的HTTP客户端,但我使用requests重新编写。
答案 1 :(得分:0)
你可以使用硒。
from selenium import webdriver
driver = webdriver.PhantomJS("./phantomjs") # path to phantomjs binary
driver.get("www.face.com")
## refer https://pypi.python.org/pypi/selenium
driver.quit() # quit driver
答案 2 :(得分:0)
你可以使用cgi脚本,你应该导入cgi
答案 3 :(得分:0)
您可能想要使用ghost.py这是一个用python编写的webkit Web客户端(需要PyQT)。