标签: hadoop hdfs archive hadoop-archive bigdata
我每天都有小文件进入hdfs。我打算使用hadoop archive(HAR),但是如何归档每天进入hdfs的这些小文件。例如:我今天可能会得到5个文件我需要将它们存档,明天如果我再获得5个文件,我需要将其添加到前几天的存档中。
答案 0 :(得分:2)
您无法将文件添加到现有的HAR文件中。您需要在几天内取消归档和重新归档或汇集文件,并继续创建归档文件。