我想从hdfs目录中查找最新文件,并保持原样并删除旧文件。
我在hdfs目录/ user / hive / warehouse / test中有4个文件:
MDCTabBar
我要删除所有不是最新的文件。
这意味着我的目录应包含带有时间戳记的文件2018-11-13 08:31
我可以使用-rwxrwx--x+ 3 hive hive 9 2018-11-13 04:13 /user/hive/warehouse/test/bc4151c16c98d191-72314e2e00000000_640731000_data.0.
-rwxrwx--x+ 3 hive hive 9 2018-11-13 04:35 /user/hive/warehouse/test/bc4151c16c98d191-72314e2e00000000_640731001_data.0.
-rwxrwx--x+ 3 hive hive 12 2018-11-13 08:31 /user/hive/warehouse/test/944adb43a3a5f955-659ed0e100000000_916442110_data.0.
-rwxrwx--x+ 3 hive hive 12 2018-11-13 08:31 /user/hive/warehouse/test/944adb43a3a5f955-659ed0e100000000_916442111_data.0.
如何删除较旧的文件? hdfs命令没有诸如find之类的命令,该命令只会提取最新文件。