将HTML资源保存在字节数组中

时间:2014-04-11 04:04:25

标签: java html bytearray web-crawler bytearrayoutputstream

我正在尝试将HTML资源保存在文件中以及字节数组中。我创建了一个函数来创建一个目录和一个名为saveResource的单独函数,它将下载一个HTML文件并将其存储在所述目录中。该部分功能运行良好,并存储与命令行中输入的URL对应的正确html文件。但是,我在将此文件存储到字节数组时遇到问题。该函数返回由urlString指定的资源内容的字节数组。如何编写函数以便它还将HTML文件存储在字节数组中,以便数组具有正确的内容?

1 个答案:

答案 0 :(得分:1)

“[B @ d9438de”是字节数组的地址(和类型)。

您应该打印出数组中的实际字节,而不是参考。

编辑:如果您使用BufferedReader,您可以逐行读取HTML到Strings,然后您可以执行任何您想要的正则表达式或indexOf搜索。