我需要扫描一个大文件系统(1tb)并将其保存到XML文件中。我希望这个XML文件的结构如代码中所述。
有人知道如何在Python中逐个读取目录及其所有子目录和文件(因此可以将它们添加到XML文件中)吗?
<files>
<file id = '1'>
<name>myfile.file</name>
<path>path/to/file/myfile.file</path>
</file>
</files>
答案 0 :(得分:0)
您可能希望将递归过程与os
模块结合使用。该模块具有列出目录内容和告知项目是否是os.listdir
,os.path.isdir
和os.path.isfile
的目录的功能。使用这些,你应该能够相对容易地做你的建议。我不知道您是否希望保留目录结构,如果不是,您只需存储文件并丢弃目录。