无法使用jsoup获取图像的网址

时间:2014-11-04 22:22:46

标签: java android jsoup malformedurlexception

我正在尝试获取一系列图像的网址:

for(Element img : document.select(".left-column .strillo-content .lazy img[src]")) {
    InputStream input = new java.net.URL(imageMainUrl).openStream();
    Bitmap bitmap = BitmapFactory.decodeStream(input);
    images.add(bitmap);
}

但每当我尝试运行我的应用时,都会收到此警告:

java.net.MalformedURLException: Unknown protocol: data
at java.net.URL.<init>(URL.java:184)
at java.net.URL.<init>(URL.java:127)

所以我试图打印网址,我得到了这个:

data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7

我可以弄明白为什么,因为我100%确定我选择的元素是正确的,并且我对网站的其他部分做了同样的过程并且它有效..

更新1 : 我尝试过这种方法来解码'base64'图像:

byte[] decodedString = Base64.decode(imageMainUrl, Base64.DEFAULT);
Bitmap bitmap = BitmapFactory.decodeByteArray(decodedString, 0, decodedString.length);

但结果是一样的..

1 个答案:

答案 0 :(得分:0)

它是数据URI方案

http://en.wikipedia.org/wiki/Data_URI_scheme

它允许在URI中添加内联数据。

修改

此代码有效,它提供1px * 1px gif图像。我使用了org.apache.commons.codec.binary.Base64

中的commons-codec
String uri = "data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7";
byte[] decodedString = Base64.decodeBase64(uri.substring(uri.indexOf("data:image/gif;base64,") + "data:image/gif;base64,".length()));
ByteArrayInputStream is = new ByteArrayInputStream(decodedString);
FileOutputStream os = new FileOutputStream(new File("/tmp/test.gif"));

byte[] buffer = new byte[1024];
int length;

// copy the file content in bytes 
while ((length = is.read(buffer)) > 0)
{
    os.write(buffer, 0, length);
}

is.close();
os.close();