历史保持在hadoop

时间:2016-11-07 18:32:50

标签: unix hadoop hive

我们如何清除4个月以上hadoop的数据?数据基于mkt和月

进行分区

假设我们在分区表中有数据,如

/user/test/mkt=1/month=200001
/user/test/mkt=1/month=200002
/user/test/mkt=1/month=200005

例如,当我们获得200006个月的数据时,我们需要清除第一个记录,即/user/test/mkt=1/month=200001;当我们得到200007时,我们需要删除200002数据。

通过这种方式,我们可以随时维持5个月的数据。

0 个答案:

没有答案