根据HTML元素的href下载文件

时间:2012-10-31 12:59:32

标签: java ftp download jsoup

我正在创建一个Java应用程序,它解析HTML并获取所有<audio><img><video>标记。我是用jsoup做的。我有属性href,因此我得到了链接,我想通过标签将文件下载到我的PC。这可能通过Java吗?

我看到一种常见的格式是ftp://user:password@host:port/filePath;type=i.,但我不知道网站的FTP,以及我如何下载图像和链接。

1 个答案:

答案 0 :(得分:2)

首先,使用Node#absUrl()从Jsoup中的href属性获取绝对URL。

String absUrl = element.absUrl("href");

然后,您可以使用InputStream获取URL#openStream()

InputStream input = new URL(absUrl).openStream();

然后您可以将其写入任意OutputStream the usual way。例如。到FileOutputStream

OutputStream output = new FileOutputStream(somepath);
// Just write input to output the usual way.

请注意,这一切都与FTP无关。这是一个完全不同的主题。