通过servlet将pdf流式传输到浏览器

时间:2010-10-06 05:39:43

标签: java pdf servlets stream

我有一个典型的servlet,它将pdf流式传输到浏览器。 pdf存储在我的servlet从中获取的内部服务器上。如果我直接从浏览器中访问servlet,则会显示pdf。如果我在网页的<IMG>标记中尝试相同的网址,那么......管道已损坏。

有关为什么会这样做的任何见解?

作为一项实验,我可以毫无问题地流式传输GIF。

这是我从内部网站中发现的代码:

public class PdfServlet extends HttpServlet {

    private static final Logger log = Logger.getLogger(PdfServlet.class.getName());

    @Override
    public void doGet(HttpServletRequest req, HttpServletResponse res) {

        String url = (String) req.getParameter("url");

        log.info("The URL is " + url);
        String format = "application/pdf";
//           String format = "image/gif";

        streamBinaryData(url, format, res);

    }

    /*
     * This Method Handles streaming Binary data
     * <p>
     * @param String urlstr ex: http;//localhost/test.pdf etc.
     * @param String format ex: pdf or audio_wav or msdocuments etc.
     * @param ServletOutputStream outstr
     * @param HttpServletResponse resp
     */
    private void streamBinaryData(
            String urlstr,
            String format,
            HttpServletResponse resp) {

        ServletOutputStream outstr = null;
        String ErrorStr = null;

        try {
            outstr = resp.getOutputStream();

            //find the right MIME type and set it as contenttype
            resp.setContentType(format);
            BufferedInputStream bis = null;
            BufferedOutputStream bos = null;
            try {
                URL url = new URL(urlstr);
                URLConnection urlc = url.openConnection();
                int length = urlc.getContentLength();

                resp.setContentLength(length);
//                resp.setHeader("Content-Length", String.valueOf(+length));
//                resp.setHeader("Content-Disposition", "inline");

                // Use Buffered Stream for reading/writing.
                InputStream in = urlc.getInputStream();
                bis = new BufferedInputStream(in);
                bos = new BufferedOutputStream(outstr);
                byte[] buff = new byte[length];
                int bytesRead;
                // Simple read/write loop.
                while (-1 != (bytesRead = bis.read(buff, 0, buff.length))) {
                    log.info("Got a chunk of " + bytesRead);
                    bos.write(buff, 0, bytesRead);
                }
            } catch (Exception e) {
                e.printStackTrace();
                ErrorStr = "Error Streaming the Data";
                outstr.print(ErrorStr);
            } finally {
                log.info("finally!!!");
                if (bis != null) {
                    bis.close();
                }
                if (bos != null) {
                    bos.close();
                }
                if (outstr != null) {
                    outstr.flush();
                    outstr.close();
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

...和HTML文件。 pdf因管道损坏而失败,即使内容类型以'application / pdf'形式返回,也会显示gif图像。

<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <title>Cheesy Servlet Experiment</title>
    </head>
    <body>
        <h1>Cheesy Servlet Experiment</h1>

        <P>
            <img src="http://10.0.0.9/ServletExperiment/pdf?url=http%3a%2f%2fwww.samplepdf.com%2fsample.pdf" alt="yah mon">
        <P>
            <img src="http://10.0.0.9/ServletExperiment/pdf?url=http%3a%2f%2fbbs.homeshopmachinist.net%2fimages%2fstatusicon%2fforum_new.gif" alt="yah mon">
    </body>
</html>

编辑 - 以下在FF中有效。我不知道它有多标准。

<object data="http://www.samplepdf.com/sample.pdf" type="application/pdf" width="600" height="600">
    alt : <a href="http://www.samplepdf.com/sample.pdf">test.pdf</a>
</object>

Interesting info here。看起来得到了相当好的支持。

4 个答案:

答案 0 :(得分:4)

您的浏览器甚至可以在img元素中显示PDF文件吗?那真的不太可能。我认为当浏览器发现它实际上不是图像时,它会结束连接。

有些浏览器不会抱怨内容类型。他们检查图像文件并找出图像本身的格式。这可以解释为什么显示您的GIF图像。

答案 1 :(得分:3)

问题是您正在尝试使用img标记显示PDF文档。 img只能处理JPEG,GIF或PNG等简单图片格式。

通常,普通浏览器无法自行显示PDF内容。如果没有安装PDF查看器插件,浏览器将只显示一个保存对话框来下载PDF文件。

所以最安全的方法是HTML页面只包含指向PDF文件的链接。也许用target="_blank"打开一个新的浏览器窗口。

答案 2 :(得分:1)

你应该使用一个锚标签(如果你必须使用一个img,有一个A包裹IMG,IMG的src指向一个真实的图像)。锚点的href将是显示PDF的servelt。 make suer你在servlet中设置了正确的内容类型。

答案 3 :(得分:0)

第一件事:您正试图立即阅读length。 这不是一个好的做法,因为它确保你完成任务

尝试阅读较小的块 byte [] read_buffer = new byte[1024 * 10] 这样你就可以一次读取10kb。

bos上写下10kb。

保持此循环,直到-1函数获得read

是的。你不应该使用img tag for pdf