以下代码从dir 1 中选择随机的文件样本(在本例中为50)并将其复制到具有相同名称的新文件夹。
但是,我需要从中采样数百个文件夹(并复制到具有相同名称的新文件夹)。
如何调整代码的第一部分,以便遍历所有子目录,并将示例移动到具有相同名称的新文件夹。 (所以sub dir 1 的样本转到dir 1 ,sub dir 2 的样本转到dir 2 等。)
import os
import shutil
import random
from shutil import copyfile
sourcedir = '/home/mrman/dataset-python/train/1/'
newdir = '/home/mrman/dataset-python/sub-train/1'
filenames = random.sample(os.listdir(sourcedir), 50)
for i in filenames:
shutil.copy2(sourcedir + i, newdir)
答案 0 :(得分:5)
您希望使用os.walk
。查看documentation
运行以下内容以了解其工作原理,并阅读文档以了解如何将其用于您的解决方案。最终,将会发生的是,您将从您提供的路径中遍历整个目录结构,每次迭代将为您提供当前路径,该级别中的所有目录以及所有文件。
另外,假设您想要在某个特定的完整路径上执行操作,请确保在创建路径时使用os.path.join。
your_path = "/some/path/you/want"
for path, dirs, files in os.walk(your_path):
print(path)
print(dirs)
print(files)
答案 1 :(得分:3)
解决方案比预期的简单(感谢@idjaw提示):
import os, sys
import shutil
import random
from shutil import copyfile
#folder which contains the sub directories
source_dir = '/home/mrman/dataset-python/train/'
#list sub directories
for root, dirs, files in os.walk(source_dir):
#iterate through them
for i in dirs:
#create a new folder with the name of the iterated sub dir
path = '/home/mrman/dataset-python/sub-train/' + "%s/" % i
os.makedirs(path)
#take random sample, here 3 files per sub dir
filenames = random.sample(os.listdir('/home/mrman/dataset-python/train/' + "%s/" % i ), 3)
#copy the files to the new destination
for j in filenames:
shutil.copy2('/home/mrman/dataset-python/train/' + "%s/" % i + j, path)