答案 0 :(得分:3)
您可以使用Filesystem API来获取HDFS文件或目录的修改时间,然后使用python时间格式化函数来获取预期格式的日期。例如:
import time
path = lambda p: spark._jvm.org.apache.hadoop.fs.Path(p)
fs = spark._jvm.org.apache.hadoop.fs.FileSystem.get(spark._jsc.hadoopConfiguration())
time_ts = fs.getFileStatus(path('/tmp')).getModificationTime()
print(time.strftime("%Y-%m-%d", time.localtime(time_ts / 1000)))