我的S3存储桶中有太多文件采用不同的文件格式。所以我想从所有具有 .JSON 扩展名的子文件夹复制到另一个文件夹。
当前结构:
S3://mybucket/f1/file.JPG
S3://mybucket/f1/newfile.JSON
S3://mybucket/f2/Oldfile.JSON
应将(JSON FILES)复制到文件夹Arrange:
S3://mybucket/arrange/newfile.JSON
S3://mybucket/arrange/Oldfile.JSON
我试过了(但是没有JSON过滤器)From stackoverflow
import os
import boto3
old_bucket_name = 'SRC'
old_prefix = 'A/B/C/'
new_bucket_name = 'TGT'
new_prefix = 'L/M/N/'
s3 = boto3.resource('s3')
old_bucket = s3.Bucket(old_bucket_name )
new_bucket = s3.Bucket(new_bucket_name )
for obj in old_bucket.objects.filter(Prefix=old_prefix):
old_source = { 'Bucket': old_bucket_name,
'Key': obj.key}
# replace the prefix
new_key = obj.key.replace(old_prefix, new_prefix)
new_obj = new_bucket.Object(new_key)
new_obj.copy(old_source)
答案 0 :(得分:0)
您可以为JSON文件保留一个过滤器,如下所示:
for obj in old_bucket.objects.filter(Prefix=old_prefix):
if obj.key.endswith('.JSON'):
old_source = { 'Bucket': old_bucket_name,
'Key': obj.key}
# replace the prefix
new_key = obj.key.replace(old_prefix, new_prefix)
new_obj = new_bucket.Object(new_key)
new_obj.copy(old_source)