无法使用org.apache.commons.io java库下载pdf weblinks

时间:2013-10-19 14:34:33

标签: java apache file-io download pdf-generation

我正在尝试使用org.apache.commons.io库java下载PDF网页链接。 我想下载'https://----------------.pdf'intp pdf文件,当我运行以下java类时,它会在我的磁盘上创建目标pdf,但我无法打开或读取该pdf。它会抛出错误文件已损坏或无法读取。

如果有人会检查我的代码中的错误以及如何将pdf weblinks下载到pdf文件中,我将不胜感激。

import java.io.File;
import java.io.IOException;
import java.net.URL;

import org.apache.commons.io.FileUtils;

public class Simple {
    public static void main(String[] args) {
        try {
            URL url = new URL("https://docs.google.com/**********.pdf");
            File destination = new File("kodejava.html");

            //
            // Copy bytes from the URL to the destination file.
            //
            FileUtils.copyURLToFile(url, destination);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

1 个答案:

答案 0 :(得分:0)

您需要将文件保存为pdf,而不是html。尝试将下载的文件重命名为kodejava.pdf并打开。我可以将其下载为.pdf并打开它。