从目录中仅找到最新的hdfs文件

时间:2018-11-13 14:15:56

标签: unix hadoop hdfs hadoop2

我想从hdfs目录中查找最新文件,并保持原样并删除旧文件。

我在hdfs目录/ user / hive / warehouse / test中有4个文件:

MDCTabBar

我要删除所有不是最新的文件。

这意味着我的目录应包含带有时间戳记的文件2018-11-13 08:31

我可以使用-rwxrwx--x+ 3 hive hive 9 2018-11-13 04:13 /user/hive/warehouse/test/bc4151c16c98d191-72314e2e00000000_640731000_data.0. -rwxrwx--x+ 3 hive hive 9 2018-11-13 04:35 /user/hive/warehouse/test/bc4151c16c98d191-72314e2e00000000_640731001_data.0. -rwxrwx--x+ 3 hive hive 12 2018-11-13 08:31 /user/hive/warehouse/test/944adb43a3a5f955-659ed0e100000000_916442110_data.0. -rwxrwx--x+ 3 hive hive 12 2018-11-13 08:31 /user/hive/warehouse/test/944adb43a3a5f955-659ed0e100000000_916442111_data.0.

对这些文件进行排序

如何删除较旧的文件? hdfs命令没有诸如find之类的命令,该命令只会提取最新文件。

0 个答案:

没有答案