hadoop序列文件是否向其添加虚拟数据

时间:2018-05-03 04:33:00

标签: hadoop mapreduce sequencefile

在我的情况下,我试图将所有给定的图像文件合并到hadoop序列文件中,以避免小文件问题。因此,我首先在mapper应用程序的帮助下创建了序列文件。每个图像文件的关键是它的路径,相应的值将是图像文件的字节数组。在将图像写入序列文件时,图像的字节数组的大小为14k。每当我尝试在另一个映射器的帮助下从序列文件(第一个映射器的输出)中读取值时,读取字节数组的大小会急剧增加,以便说出500k。不知道问题出在哪里。这个你能帮我吗。

0 个答案:

没有答案