循环浏览子文件夹并在Python中保存到.csv

时间:2020-01-22 14:54:09

标签: python python-3.x loops for-loop iteration

我有一个名为Folder的文件夹,其结构如下:

Folder/
├── Folder1
│   ├── image1.jpg
│   ├── image2.jpg
│   ├── image3.jpg
│   ├── image4.jpg
│   └── image5.jpg
├── Folder2
│   ├── image1.jpg
│   ├── image2.jpg
│   ├── image3.jpg
│   ├── image4.jpg
│   └── image5.jpg
├── Folder3
│   ├── image1.jpg
│   ├── image2.jpg
│   ├── image3.jpg
│   ├── image4.jpg
│   └── image5.jpg
└── Folder4
    ├── image1.jpg
    ├── image2.jpg
    ├── image3.jpg
    ├── image4.jpg
    └── image5.jpg

我有一个代码可以打印文件夹以及每个文件夹中的图像。

rootDir = '.'
for dirName, subdirList, fileList in os.walk(rootDir):
    print('Found directory: %s' % dirName)
    for fname in fileList:
        print('\t%s' % fname)"   

但是,我想编写一个代码来遍历子文件夹,并将5张图像的每张保存到.csv文件中。例如,如果我有参与者1,我想要一个.csv文件,其中包含来自Folder1的图像;如果我有参与者2,我想要一个.csv文件,其中包含来自Folder2的图像,等等。

我认为我可能需要创建一个空列表,然后将其保存到如下的.csv文件中:

lst = []

cols = ['participant', 'imagefile']

pd.DataFrame(lst,columns=cols).to_csv('imagefiles.csv', index=False)

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:0)

这是Python 3.6+(由于pathlib而产生3.4+,而由于f-strings而引起3.6+的可能解决方案 ):

from pathlib import Path
import csv


folder = Path('/path/to/main/Folder'):
csvdir = Path('/path/to/store/csv/files')
participants = [1, 2, 3, 4]
headers = ['participant', 'imagefile']

for participant in participants:
    participant_folder = folder / f'Folder{participant}'

    # Do we have a Folder for participant number? 
    if participant_folder.is_dir():
        # create a csv file in csvdir for participant
        with Path(csvdir / f'imagefiles{participant}.csv').open('w') as f:
            csvwriter = csv.writer(f, quote=csv.QUOTEALL)

            cswriter.writerow(headers)

            for image in participant_folder.glob('*.jpg'):
                csvwriter.writerow([participant, image])