我在下面使用此代码,但生成的图像已损坏。我想可能是因为渲染选项。有人知道发生了什么吗?
package webpageprinter;
import java.net.URL;
import java.awt.image.BufferedImage;
import javax.imageio.ImageIO;
import java.beans.PropertyChangeListener;
import java.beans.PropertyChangeEvent;
import javax.swing.text.html.*;
import java.awt.*;
import javax.swing.*;
import java.io.*;
public class WebPagePrinter {
private BufferedImage image = null;
public BufferedImage Download(String webpageurl) {
try
{
URL url = new URL(webpageurl);
final JEditorPane jep = new JEditorPane();
jep.setContentType("text/html");
((HTMLDocument)jep.getDocument()).setBase(url);
jep.setEditable(false);
jep.setBounds(0,0,1024,768);
jep.addPropertyChangeListener("page",new
PropertyChangeListener() {
@Override
public void propertyChange(PropertyChangeEvent e) {
try
{
image = new
BufferedImage(1024,768,BufferedImage.TYPE_INT_RGB );
Graphics g = image.getGraphics();
Graphics2D graphics = (Graphics2D) g;
graphics.setRenderingHint(RenderingHints.KEY_ANTIALIASING, RenderingHints.VALUE_ANTIALIAS_ON);
jep.paint(graphics);
ImageIO.write(image,"png",new File("C:/webpage.png"));
}
catch (Exception re)
{
re.printStackTrace();
}
}});
jep.setPage(url);
}
catch (Exception e)
{
e.printStackTrace();
}
return image;
}
public static void main(String[] args) {
new WebPagePrinter().Download("http://www.google.com");
}
}
答案 0 :(得分:4)
我认为该代码中存在3个问题和一个脆弱性:
JEditorPane
从未打算成为浏览器。 setPage(URL)
异步加载。有必要添加一个监听器来确定页面何时加载。脆弱性质包含在对setBounds()
的调用中。使用布局。
但是看看这张图片,似乎3在这里不适用,2不是问题。它归结为第1点。JEditorPane
从未打算作为浏览组件。底部的那些随机字符是JavaScript,JEP不仅不是脚本,而是在页面中不正确地显示。
答案 1 :(得分:2)
您可以使用Java Robot (API Here)进行整个屏幕捕获。
import java.awt.AWTException;
import java.awt.Rectangle;
import java.awt.Robot;
import java.awt.Toolkit;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
public class RobotExp {
public static void main(String[] args) {
try {
Robot robot = new Robot();
// Capture the screen shot of the area of the screen defined by the rectangle
BufferedImage bi=robot.createScreenCapture(new Rectangle(Toolkit.getDefaultToolkit().getScreenSize()));
ImageIO.write(bi, "jpg", new File("C:/imageTest.jpg"));
} catch (AWTException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
我找到了这个例子here.经过一些修改。
答案 2 :(得分:1)
您的问题是您正在使用Java的JEditorPane
来呈现网页,该网页的HTML呈现引擎非常有限。它根本无法显示更复杂的网页以及现代浏览器。
如果您需要使用Java生成正确呈现的复杂网页的屏幕截图,最好的方法可能是像Firefox一样use Selenium to control a real browser。
答案 3 :(得分:1)
HTML文字。在这种情况下使用的工具包就是这个类 javax.swing.text.html.HTMLEditorKit,提供HTML 3.2支持。
可能这解释了为什么页面看起来有点破碎,因为现在页面大多使用HTML4,5或XHTML ......
这里有一篇关于Java浏览器组件的文章:Best Java/Swing browser component?
答案 4 :(得分:1)
看看flying-saucer。非常适合从HTML页面生成图像和pdf。
答案 5 :(得分:1)
我使用VirtualFramebuffer和Firefox Binary获得Selenium WebDriver的最佳结果。 这是在ubuntu下测试的。您需要安装xvfb和Firefox。优势:您运行的是真正的浏览器,因此屏幕截图看起来像真实浏览器中的真实屏幕截图。
首先安装Firefox和虚拟帧缓冲:
aptitude安装xvfb firefox
编译并运行此类,之后打开/tmp/screenshot.png
import java.io.File;
import java.io.IOException;
import org.apache.commons.io.FileUtils;
import org.openqa.selenium.OutputType;
import org.openqa.selenium.TakesScreenshot;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.firefox.FirefoxBinary;
import org.openqa.selenium.firefox.FirefoxDriver;
public class CaptureScreenshotTest
{
private static int DISPLAY_NUMBER=99;
private static String XVFB="/usr/bin/Xvfb";
private static String XVFB_COMMAND= XVFB + " :" + DISPLAY_NUMBER;
private static String URL="http://www.google.com/";
private static String RESULT_FILENAME="/tmp/screenshot.png";
public static void main ( String[] args ) throws IOException
{
Process p = Runtime.getRuntime().exec(XVFB_COMMAND);
FirefoxBinary firefox = new FirefoxBinary();
firefox.setEnvironmentProperty("DISPLAY", ":" + DISPLAY_NUMBER);
WebDriver driver = new FirefoxDriver(firefox, null);
driver.get(URL);
File scrFile = ( (TakesScreenshot) driver ).getScreenshotAs(OutputType.FILE);
FileUtils.copyFile(scrFile, new File(RESULT_FILENAME));
driver.close();
p.destroy();
}
}