标签: hdfs parquet snapshot
我了解到hdfs快照可以跟踪目录中添加或删除的文件。当我有连续附加文件(PARQUET)时的行为如何?
答案 0 :(得分:1)
创建目录/文件的快照时,它们会添加到子目录 /。snapshot 中,因此无论文件格式是什么,它们都按日期升序排列!没有快照的最大数量。
hdfs快照可跟踪目录中添加或删除的文件
如果我错了,请纠正我,但是快照会跟踪每个更改(即使在文件中),而不仅仅是从目录中添加和删除的文件。
我希望这可以帮助您了解他们的行为!
HDFS snapshots documentation