获取所有src(或SRC)URL Java

时间:2014-04-05 18:48:34

标签: java url bytearray web-crawler

我试图获取出现在字节数组中的所有src(或SRC)URL,但是,我不知道如何实现字节数组。我现在的代码提取了以src =或SRC =开头的HTML的所有部分,并提取出正确的项目。但是,字节数组如何在此中发挥作用?字节数组是一系列字符,可能包含从URL内容初始化的src(或SRC)URL。此外,位于此函数末尾的向量字符串应包含数据中找到的所有src属性。我有一个saveResource函数,可以将资源保存在文件中,也可以保存在字节数组中,如下所示。

如何将我的程序提取的src url存储到字节数组中?

1 个答案:

答案 0 :(得分:0)

看起来你问的是如何在字节数组中存储Vector<String>。这听起来很奇怪,所以也许我把它解释错了。

  • Vector是可序列化的。您可以使用ObjectOutputStream将它们写入输出流。
  • ByteArrayOutputStream实现了写入内存的OutputStream。它有一个方法toByteArray(),您可以调用它来将其内容作为字节数组。

这应该足以解决这个问题。

编辑:也许还有一些System.arraycopy,如果你需要它进入data参数...再次,很奇怪。