清除hdfs中的/ tmp目录

时间:2015-08-02 18:57:01

标签: hadoop hdfs

这是否正确, hdfs 中的/tmp目录每24小时自动清除一次(默认情况下)?

1 个答案:

答案 0 :(得分:1)

HDFS / tmp 目录主要用作mapreduce操作期间的临时存储。 Mapreduce工件,中间数据等将保存在此目录下。 mapreduce作业执行完成后,应自动清除这些文件。如果删除此临时文件,则会影响当前运行的mapreduce作业。

临时文件由pig创建。临时文件删除最后发生。如果脚本执行已归档或被杀死,Pig不会处理临时文件删除。然后你必须处理这种情况。您最好在脚本本身处理此临时文件清理活动。