如何从网页制作截图?

时间:2018-03-01 11:54:33

标签: python python-3.x module screenshot webpage

如何从任何网址(网页)制作屏幕截图?

我在尝试:

from .ghost import Ghost
ghost = Ghost(wait_timeout=4)
ghost.open('http://www.google.com')
ghost.capture_to('screen_shot.png')

结果:

No module named '__main__.ghost'; '__main__' is not a package

我也在尝试:

Python Webkit making web-site screenshots using virtual framebuffer

Take screenshot of multiple URLs using selenium (python)

Fastest way to take a screenshot with python on windows

Take a screenshot of open website in python script

我还尝试过其他未列在此处的方法。 什么都没有成功。或者找不到错误或模块..或或或。 我累了。有没有一种简单的方法可以使用Python 3.X制作网页的屏幕截图?

upd1:

C:\prg\PY\PUMA\tests>py save-web-html.py
Traceback (most recent call last):
File "save-web-html.py", line 2, in <module>
from .ghost import Ghost
ModuleNotFoundError: No module named '__main__.ghost'; '__main__' is not a package

UPD2:

C:\prg\PY\PUMA\tests>py save-web-html.py
Exception ignored in: <bound method Ghost.__del__ of <ghost.ghost.Ghost object at 0x0000020A169CF860>>
Traceback (most recent call last):
  File "C:\Users\Coar\AppData\Local\Programs\Python\Python36\lib\site-packages\ghost\ghost.py", line 325, in __del__
    self.exit()
  File "C:\Users\Coar\AppData\Local\Programs\Python\Python36\lib\site-packages\ghost\ghost.py", line 315, in exit
    self._app.quit()
AttributeError: 'NoneType' object has no attribute 'quit'
Traceback (most recent call last):
  File "save-web-html.py", line 4, in <module>
    ghost = Ghost(wait_timeout=4)
TypeError: __init__() got an unexpected keyword argument 'wait_timeout'

1 个答案:

答案 0 :(得分:1)

在80年代后期,这可能是一个简单的任务,只需将一些html渲染到图像而不是屏幕。

但是现在网页需要客户端执行来构建其DOM的一部分并根据客户端发起的AJAX(或等效的)请求重新呈现......它是一个完整的东西&#34; web 2.0&#34;的事情。

http://google.com这样的网站呈现为一个简单的html返回应该很容易,但渲染像https://www.facebook.com/https://www.kogan.com/这样的内容将会有很多回复。第四部通信显示您期望看到的内容。

因此将其限制为纯python解决方案可能并不合理;我不知道基于python的浏览器。 考虑运行单独的服务来截取屏幕截图,并使用您的核心应用程序(在python中)获取请求的屏幕截图。

我刚用docker尝试了一些,其中许多人都在讨论https和前面提到的ajax行为。

earlyclaim/docker-manet似乎有效demo page

编辑:根据您的评论,您需要使用第二个请求呈现的图表中的数据。

你只需要从https://www.minnowbooster.net/limit/chart

返回json
try:
    from urllib.request import urlopen  # py3
except ImportError:
    from urllib2 import urlopen  # py2
import json

url = 'https://www.minnowbooster.net/limit/chart'

response = urlopen(url)
data_str = response.read().decode()
data = json.loads(data_str)

print(data)