无法从互联网上获取pdf

时间:2013-06-18 07:23:48

标签: java pdf itext

我正在尝试从互联网上下载pdf内容并将其下载到本地文件。 我正在使用iText阅读pdf并使用Java流来编写它。

编写文件后,无法在PDF阅读器中打开新文件。

PdfReader reader = new PdfReader(strURL);
FileOutputStream fos = new FileOutputStream(new File(fileName));
fos.write(reader.getPageContent(1));
fos.flush();
fos.close();

我正试图从this link

获取PDF

我调试了一些东西。以下是调查结果。

  

reader.getEofPos()

给出291633,与文件长度相同。但

reader.getPageContent(1).length;

仅提供42360个字节。显然字节读取小于实际大小。

只有一页pdf存在

reader.getNumberOfPages() =1 

我是否需要为读者指定更多内容来阅读整个pdf文件?

1 个答案:

答案 0 :(得分:0)

如果您要做的就是从互联网上下载PDF并将其保存在本地,这可以通过简单的HTTP Web请求来完成。互联网下载通常只是一个HTTP GET请求,您可以通过执行以下操作来完成:

URLConnection connection = new URL(url).openConnection();
connection.setRequestProperty("Accept-Charset", charset);
InputStream response = connection.getInputStream();

获得响应后,您可以将字节保存到您选择的路径中。