我正在编写一个遍历文件夹的脚本,然后扫描每个文件夹的文件内容并将数据附加到中央CSV。我只是想知道,对于每个文件来说,打开和附加数据还是打开CSV文件并在其中运行循环是否更好,例如。
for dir_name in os.listdir('Some/Folder/Name'):
df = folderstats.folderstats(f'Some/Folder/Name/{dir_name}', ignore_hidden=True)
with open('exported_data.csv', 'a') as f:
df.to_csv(f, header=False)
或(我不知道这是否可行,或者理论是否正确,但代码错误)
with open('exported_data.csv', 'a') as f:
for dir_name in os.listdir('Some/Folder/Name'):
df = folderstats.folderstats(f'Some/Folder/Name/{dir_name}', ignore_hidden=True)
df.to_csv(f, header=False)
哪个是正确的?我大约有100,000多个文件来获取和追加数据。