在Python中将HTML转换为图像

时间:2011-04-12 10:31:20

标签: python html image imagemagick graphicsmagick

我想在Python中将以下HTML转换为PNG图像。

<html>
    <b>Bold text</b>
</html>

这个HTML当然是一个例子。

我尝试了'pisa',但它将html转换为PDF,而不是图像。 我可以将HTML转换为PDF然后将PDF转换为PNG,但我想知道是否有任何直接解决方案(即HTML到PNG)。任何内置或外置模块都可以很好地工作。

如果可以在Graphicsmagick或Imagemagick中完成,那么它将是完美的。

3 个答案:

答案 0 :(得分:10)

webkit2png。原始版本仅限OSX,但幸运的是有一个跨平台的分支: https://github.com/AdamN/python-webkit2png

答案 1 :(得分:4)

扩展vartec的答案,并解释如何使用它......

安装webkit2png
最简单的方法可能是简单地克隆github仓库并运行设置。

mkdir python-webkit2png
git clone https://github.com/adamn/python-webkit2png.git python-webkit2png
python setup.py install

这需要已安装python和git。 对于cygwin,这将添加webkit2png作为路径的命令。我还没有为其他终端/操作系统测试过这个。

运行
假设您的网站位于当前目录中。 (我有一个使用css样式表的html文件 - 但是没有必要考虑css文件。)

webkit2png something.html -o something.png

选项
webkit2png -h通知我们:

Options:
  --version             show program's version number and exit
  -h, --help            show this help message and exit
  -x WIDTH HEIGHT, --xvfb=WIDTH HEIGHT
                        Start an 'xvfb' instance with the given desktop size.
  -g WIDTH HEIGHT, --geometry=WIDTH HEIGHT
                        Geometry of the virtual browser window (0 means
                        'autodetect') [default: (0, 0)].
  -o FILE, --output=FILE
                        Write output to FILE instead of STDOUT.
  -f FORMAT, --format=FORMAT
                        Output image format [default: png]
  --scale=WIDTH HEIGHT  Scale the image to this size
  --aspect-ratio=RATIO  One of 'ignore', 'keep', 'crop' or 'expand' [default:
                        none]
  -F FEATURE, --feature=FEATURE
                        Enable additional Webkit features ('javascript',
                        'plugins')
  -c COOKIE, --cookie=COOKIE
                        Add this cookie. Use multiple times for more cookies.
                        Specification is value of a Set-Cookie HTTP response
                        header.
  -w SECONDS, --wait=SECONDS
                        Time to wait after loading before the screenshot is
                        taken [default: 0]
  -t SECONDS, --timeout=SECONDS
                        Time before the request will be canceled [default: 0]
  -W, --window          Grab whole window instead of frame (may be required
                        for plugins)
  -T, --transparent     Render output on a transparent background (Be sure to
                        have a transparent background defined in the html)
  --style=STYLE         Change the Qt look and feel to STYLE (e.G. 'windows').
  --encoded-url         Treat URL as url-encoded
  -d DISPLAY, --display=DISPLAY
                        Connect to X server at DISPLAY.
  --debug               Show debugging information.
  --log=LOGFILE         Select the log output file

值得注意的选项是宽度和高度的设置。

<强>疑难解答
使用cygwin,我遇到了webkit2png: cannot connect to X server :0.0。 为了解决这个问题(我已经执行过export DISPLAY=0.0),我必须启动一个X-Server。在cygwin上,这可以通过在第二个终端中运行startxwin来完成。确保首先通过cygwin设置安装它。

答案 2 :(得分:2)

另一种可能的解决方案是使用GrabzIt的免费HTML to Image API for Python。然后,您可以将HTML转换为PDF代码,如下所示:

import GrabzItClient
grabzIt = GrabzItClient.GrabzItClient("APPLICATION KEY", "APPLICATION SECRET")
grabzIt.HTMLToImage("<html><b>Bold text</b></html>")    
grabzIt.SaveTo("test.png")

完全披露我是API创建者。