Python:根据csv文件中的条目对文件进行排序的程序

时间:2017-12-11 18:42:52

标签: python csv

import os, unicodecsv as csv
# open and store the csv file
IDs = {}
with open('labels.csv','rb') as csvfile:
    timeReader = csv.reader(csvfile, delimiter = ',')
    # build dictionary with associated IDs
    for row in timeReader:
        IDs[row[0]] = row[1]
# move files
path = 'train/'
tmpPath = 'train2/'
for oldname in os.listdir(path):
    # ignore files in path which aren't in the csv file
    if oldname in IDs:
        try:
            os.rename(os.path.join(path, oldname), os.path.join(tmpPath, IDs[oldname]))
        except:
            print 'File ' + oldname + ' could not be renamed to ' + IDs[oldname] + '!'

我正在尝试根据this csv文件对文件进行排序。但该文件包含许多具有相同名称的ID。有没有办法将同名文件移动到1个文件夹,或者如果目录中已存在同名文件,则在文件前面添加一个数字?

Example-

id                   name
001232131hja1.jpg     golden_retreiver
0121221122ld.jpg      black_hound
0232113222kl.jpg      golden_retreiver
0213113jjdsh.jpg      alsetian
05hkhdsk1233a.jpg     black_hound

我实际上想将具有与golden_retreiver对应的id的所有文件移动到一个文件夹,依此类推。

1 个答案:

答案 0 :(得分:1)

根据您的描述,这是我的方法:

import csv
import os

SOURCE_ROOT = 'train'
DEST_ROOT = 'train2'

with open('labels.csv') as infile:
    next(infile)  # Skip the header row
    reader = csv.reader(infile)
    seen = set()
    for dogid, breed in reader:
        # Create a new directory if needed
        if breed not in seen:
            os.mkdir(os.path.join(DEST_ROOT, breed))
            seen.add(breed)

        src = os.path.join(SOURCE_ROOT, dogid + '.jpg')
        dest = os.path.join(DEST_ROOT, breed, dogid + '.jpg')

        try:
            os.rename(src, dest)
        except WindowsError as e:
            print e

注释

  • 对于数据文件中的每一行,我在目的地创建品种目录。我使用set seen来确保我只创建一次目录。
  • 在此之后,将文件移动到位是一个小问题
  • 一个可能的移动错误:源目录中不存在文件。在这种情况下,代码只打印出错误并忽略它。