我正在使用python库查询Google Cloud Storage,我正在使用命名层次结构在Storage中组织信息。例如:
my_bucket/simulations/version_1/data...
my_bucket/simulations/version_2/data...
my_bucket/simulations/version_3/data...
my_bucket/other_data/more_data...
我的问题是:是否可以使用list_blobs
或其他方法进行查询,以检索仅包含“simulations”目录中的版本的列表,而不是模拟下的所有blob?
作为参考,这将以分页方式返回所有blob:
cursor = bucket.list_blobs(prefix='simulations')
答案 0 :(得分:2)
我使用了prefix
方法的delimiter
和list_blobs
参数,并且此代码有效:
from google.cloud import storage
def ls(bucket_name, prefix, delimiter):
storage_client = storage.Client()
bucket = storage_client.get_bucket(bucket_name)
cursor = bucket.list_blobs(prefix=prefix, delimiter=delimiter)
for blob in cursor:
pass
for prefix in cursor.prefixes:
print prefix
ls(your_bucket_name, 'simulations/', '/')
输出:
simulations/version-1/
simulations/version-2/
simulations/version-3/
请注意,这只会在simulations/
目录中显示目录的名称,文件将被省略。