如何从任何网址(网页)制作屏幕截图?
我在尝试:
from .ghost import Ghost
ghost = Ghost(wait_timeout=4)
ghost.open('http://www.google.com')
ghost.capture_to('screen_shot.png')
结果:
No module named '__main__.ghost'; '__main__' is not a package
我也在尝试:
Python Webkit making web-site screenshots using virtual framebuffer
Take screenshot of multiple URLs using selenium (python)
Fastest way to take a screenshot with python on windows
Take a screenshot of open website in python script
我还尝试过其他未列在此处的方法。 什么都没有成功。或者找不到错误或模块..或或或。 我累了。有没有一种简单的方法可以使用Python 3.X制作网页的屏幕截图?
upd1:
C:\prg\PY\PUMA\tests>py save-web-html.py
Traceback (most recent call last):
File "save-web-html.py", line 2, in <module>
from .ghost import Ghost
ModuleNotFoundError: No module named '__main__.ghost'; '__main__' is not a package
UPD2:
C:\prg\PY\PUMA\tests>py save-web-html.py
Exception ignored in: <bound method Ghost.__del__ of <ghost.ghost.Ghost object at 0x0000020A169CF860>>
Traceback (most recent call last):
File "C:\Users\Coar\AppData\Local\Programs\Python\Python36\lib\site-packages\ghost\ghost.py", line 325, in __del__
self.exit()
File "C:\Users\Coar\AppData\Local\Programs\Python\Python36\lib\site-packages\ghost\ghost.py", line 315, in exit
self._app.quit()
AttributeError: 'NoneType' object has no attribute 'quit'
Traceback (most recent call last):
File "save-web-html.py", line 4, in <module>
ghost = Ghost(wait_timeout=4)
TypeError: __init__() got an unexpected keyword argument 'wait_timeout'
答案 0 :(得分:1)
在80年代后期,这可能是一个简单的任务,只需将一些html渲染到图像而不是屏幕。
但是现在网页需要客户端执行来构建其DOM的一部分并根据客户端发起的AJAX(或等效的)请求重新呈现......它是一个完整的东西&#34; web 2.0&#34;的事情。
将http://google.com这样的网站呈现为一个简单的html返回应该很容易,但渲染像https://www.facebook.com/或https://www.kogan.com/这样的内容将会有很多回复。第四部通信显示您期望看到的内容。
因此将其限制为纯python解决方案可能并不合理;我不知道基于python的浏览器。 考虑运行单独的服务来截取屏幕截图,并使用您的核心应用程序(在python中)获取请求的屏幕截图。
我刚用docker尝试了一些,其中许多人都在讨论https
和前面提到的ajax
行为。
earlyclaim/docker-manet似乎有效demo page
编辑:根据您的评论,您需要使用第二个请求呈现的图表中的数据。
你只需要从https://www.minnowbooster.net/limit/chart
返回jsontry:
from urllib.request import urlopen # py3
except ImportError:
from urllib2 import urlopen # py2
import json
url = 'https://www.minnowbooster.net/limit/chart'
response = urlopen(url)
data_str = response.read().decode()
data = json.loads(data_str)
print(data)