循环遍历子目录,到示例文件

时间:2016-03-13 20:59:36

标签: python loops mkdir subdirectory

以下代码从dir 1 中选择随机的文件样本(在本例中为50)并将其复制到具有相同名称的新文件夹。

但是,我需要从中采样数百个文件夹(并复制到具有相同名称的新文件夹)。

如何调整代码的第一部分,以便遍历所有子目录,并将示例移动到具有相同名称的新文件夹。 (所以sub dir 1 的样本转到dir 1 ,sub dir 2 的样本转到dir 2 等。)

import os 
import shutil 
import random 
from shutil import copyfile

sourcedir = '/home/mrman/dataset-python/train/1/'
newdir  = '/home/mrman/dataset-python/sub-train/1'


filenames = random.sample(os.listdir(sourcedir), 50)
for i in filenames:
    shutil.copy2(sourcedir + i, newdir)

2 个答案:

答案 0 :(得分:5)

您希望使用os.walk。查看documentation

运行以下内容以了解其工作原理,并阅读文档以了解如何将其用于您的解决方案。最终,将会发生的是,您将从您提供的路径中遍历整个目录结构,每次迭代将为您提供当前路径,该级别中的所有目录以及所有文件。

另外,假设您想要在某个特定的完整路径上执行操作,请确保在创建路径时使用os.path.join

your_path = "/some/path/you/want"
for path, dirs, files in os.walk(your_path):
    print(path)
    print(dirs)
    print(files)

答案 1 :(得分:3)

解决方案比预期的简单(感谢@idjaw提示):

import os, sys
import shutil
import random
from shutil import copyfile

#folder which contains the sub directories
source_dir = '/home/mrman/dataset-python/train/'

#list sub directories 
for root, dirs, files in os.walk(source_dir):

#iterate through them
    for i in dirs: 

        #create a new folder with the name of the iterated sub dir
        path = '/home/mrman/dataset-python/sub-train/' + "%s/" % i
        os.makedirs(path)

        #take random sample, here 3 files per sub dir
        filenames = random.sample(os.listdir('/home/mrman/dataset-python/train/' + "%s/" % i ), 3)

        #copy the files to the new destination
        for j in filenames:
            shutil.copy2('/home/mrman/dataset-python/train/' + "%s/" % i  + j, path)