如何拍摄网页截图?

时间:2011-08-11 20:41:43

标签: screenshot java

我在下面使用此代码,但生成的图像已损坏。我想可能是因为渲染选项。有人知道发生了什么吗?

package webpageprinter;

import java.net.URL;
import java.awt.image.BufferedImage;
import javax.imageio.ImageIO;
import java.beans.PropertyChangeListener;
import java.beans.PropertyChangeEvent;
import javax.swing.text.html.*;
import java.awt.*;
import javax.swing.*;
import java.io.*;

public class WebPagePrinter {
private BufferedImage image = null;

public BufferedImage Download(String webpageurl) {
try
{
    URL url = new URL(webpageurl);
    final JEditorPane jep = new JEditorPane();
    jep.setContentType("text/html");
    ((HTMLDocument)jep.getDocument()).setBase(url);
    jep.setEditable(false);
    jep.setBounds(0,0,1024,768);
    jep.addPropertyChangeListener("page",new
    PropertyChangeListener() {
                @Override
    public void propertyChange(PropertyChangeEvent e) {
    try
    {
        image = new
        BufferedImage(1024,768,BufferedImage.TYPE_INT_RGB );
        Graphics g = image.getGraphics();
        Graphics2D graphics = (Graphics2D) g;
        graphics.setRenderingHint(RenderingHints.KEY_ANTIALIASING, RenderingHints.VALUE_ANTIALIAS_ON);
        jep.paint(graphics);
        ImageIO.write(image,"png",new File("C:/webpage.png"));
    }
    catch (Exception re)
    {
        re.printStackTrace();
    }
    }});
    jep.setPage(url);

}
catch (Exception e)
{
e.printStackTrace();
}
return image;
}

    public static void main(String[] args) {

        new WebPagePrinter().Download("http://www.google.com");

    }
}

6 个答案:

答案 0 :(得分:4)

我认为该代码中存在3个问题和一个脆弱性:

问题

  1. JEditorPane从未打算成为浏览器。
  2. setPage(URL)异步加载。有必要添加一个监听器来确定页面何时加载。
  3. 您可能会发现某些网站会自动拒绝与Java客户端的连接。
  4. 脆弱性

    脆弱性质包含在对setBounds()的调用中。使用布局。

    400x600

    的图像

    Google screen shot

    但是看看这张图片,似乎3在这里不适用,2不是问题。它归结为第1点。JEditorPane从未打算作为浏览组件。底部的那些随机字符是JavaScript,JEP不仅不是脚本,而是在页面中不正确地显示。

答案 1 :(得分:2)

您可以使用Java Robot (API Here)进行整个屏幕捕获。

import java.awt.AWTException;
import java.awt.Rectangle;
import java.awt.Robot;
import java.awt.Toolkit;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;

import javax.imageio.ImageIO;

public class RobotExp {

    public static void main(String[] args) {

        try {

            Robot robot = new Robot();
            // Capture the screen shot of the area of the screen defined by the rectangle
            BufferedImage bi=robot.createScreenCapture(new Rectangle(Toolkit.getDefaultToolkit().getScreenSize()));
            ImageIO.write(bi, "jpg", new File("C:/imageTest.jpg"));

        } catch (AWTException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

我找到了这个例子here.经过一些修改。

答案 2 :(得分:1)

您的问题是您正在使用Java的JEditorPane来呈现网页,该网页的HTML呈现引擎非常有限。它根本无法显示更复杂的网页以及现代浏览器。

如果您需要使用Java生成正确呈现的复杂网页的屏幕截图,最好的方法可能是像Firefox一样use Selenium to control a real browser

答案 3 :(得分:1)

javadoc states

  

HTML文字。在这种情况下使用的工具包就是这个类   javax.swing.text.html.HTMLEditorKit,提供HTML 3.2支持。

可能这解释了为什么页面看起来有点破碎,因为现在页面大多使用HTML4,5或XHTML ......

这里有一篇关于Java浏览器组件的文章:Best Java/Swing browser component?

答案 4 :(得分:1)

看看flying-saucer。非常适合从HTML页面生成图像和pdf。

答案 5 :(得分:1)

我使用VirtualFramebuffer和Firefox Binary获得Selenium WebDriver的最佳结果。 这是在ubuntu下测试的。您需要安装xvfb和Firefox。优势:您运行的是真正的浏览器,因此屏幕截图看起来像真实浏览器中的真实屏幕截图。

首先安装Firefox和虚拟帧缓冲:

  

aptitude安装xvfb firefox

编译并运行此类,之后打开/tmp/screenshot.png

import java.io.File;
import java.io.IOException;

import org.apache.commons.io.FileUtils;
import org.openqa.selenium.OutputType;
import org.openqa.selenium.TakesScreenshot;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.firefox.FirefoxBinary;
import org.openqa.selenium.firefox.FirefoxDriver;

public class CaptureScreenshotTest
{
    private static int DISPLAY_NUMBER=99;
    private static String XVFB="/usr/bin/Xvfb";
    private static String XVFB_COMMAND= XVFB + " :" + DISPLAY_NUMBER;
    private static String URL="http://www.google.com/";
    private static String RESULT_FILENAME="/tmp/screenshot.png";

    public static void main ( String[] args ) throws IOException
    {
        Process p = Runtime.getRuntime().exec(XVFB_COMMAND);
        FirefoxBinary firefox = new FirefoxBinary();
        firefox.setEnvironmentProperty("DISPLAY", ":" + DISPLAY_NUMBER);
        WebDriver driver = new FirefoxDriver(firefox, null);
        driver.get(URL);
        File scrFile = ( (TakesScreenshot) driver ).getScreenshotAs(OutputType.FILE);
        FileUtils.copyFile(scrFile, new File(RESULT_FILENAME));
        driver.close();
        p.destroy();
    }
}