Flume:无法修复接收器输出文件大小

时间:2013-07-19 11:54:53

标签: hadoop flume

我正在尝试修复接收器输出文件大小。即我试图获得每个输出文件128 MB。我尝试了几种机制(rollInterval,rollCount,rollSize)但我没有获得所需的输出。我没有得到始终128 MB的文件。我最初得到的128 MB文件,但后来有些文件生成了不同的大小,如30,40 45 MB等。而且很多新创建的文件打开并保持.tmp状态。有什么想法吗?

1 个答案:

答案 0 :(得分:0)

我认为不可能总是创建128MB大小的文件。如果Flume汇总了随机大小的数据(我的意思不是恒定大小)或者大小不变的数据但不是你要求的大小的倍数,它总会创建小于128的文件。

我想你需要有一个非常小的数据流,然后你总是会有一个tmp文件,除非这个文件被填充(128MB大)。但是如果您正在监视目录,那么文件必须是128的倍数,而不是您将拥有较小尺寸的零件文件。

希望我正确理解你的问题。