Question

我正在尝试使用org.apache.commons.io库java下载PDF网页链接。我想下载'https://----------------.pdf'intp pdf文件，当我运行以下java类时，它会在我的磁盘上创建目标pdf，但我无法打开或读取该pdf。它会抛出错误文件已损坏或无法读取。

如果有人会检查我的代码中的错误以及如何将pdf weblinks下载到pdf文件中，我将不胜感激。

import java.io.File;
import java.io.IOException;
import java.net.URL;

import org.apache.commons.io.FileUtils;

public class Simple {
    public static void main(String[] args) {
        try {
            URL url = new URL("https://docs.google.com/**********.pdf");
            File destination = new File("kodejava.html");

            //
            // Copy bytes from the URL to the destination file.
            //
            FileUtils.copyURLToFile(url, destination);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Answer 1

您需要将文件保存为pdf，而不是html。尝试将下载的文件重命名为kodejava.pdf并打开。我可以将其下载为.pdf并打开它。

无法使用org.apache.commons.io java库下载pdf weblinks

1 个答案: