目前我正在使用Amazon Web Services(AWS)并打开S3存储桶,将其内容保存到EC2中的目录,然后我从该目录中的所有内容创建tar文件并将该tar文件推送到AWS冰川。我试图完成的最后一步是在tar文件成功上传到AWS Glacier时需要终止脚本(需要3-5个小时)。
目前我很难理解如何获取archive_id并询问保险库是否已成功加载tar文件。
要与AWS Glacier交互,我一直在使用python boto工具。我包含了将文件上传到冰川的python \ boto代码以及我试图运行的一些快速测试,以确定代码是否已成功上传。到目前为止,所有测试都返回错误。
我排除了一些关于status_code的测试,这些测试也为所有内容返回false,当我尝试打印出任何这些时,只有未完成和正在进行中(正如预期)打印出任何东西,但当我尝试将archive_id或retrieve_job与我没有匹配的作业列表中返回的内容相匹配。另外一个注释是打印时保存的列表,它们都是相同的(Job(arn:aws:glacier:us-east-1:232412618534:vaults / glacier-poc))
如何在作业完成后返回true?
import boto
import sys
ACCESS_KEY_ID = "..."
SECRET_ACCESS_KEY = "..."
FILENAME = sys.argv[1]
GLACIER_VAULT_NAME = sys.argv[2]
connection = boto.connect_glacier(aws_access_key_id=ACCESS_KEY_ID, aws_secret_access_key=SECRET_ACCESS_KEY)
vault = connection.get_vault(GLACIER_VAULT_NAME)
archive_id = vault.upload_archive(FILENAME)
open("glacier.txt", "a").write(FILENAME + " " + archive_id + "\n")
retrieve_job = vault.retrieve_archive(archive_id)
a = vault.list_jobs(completed=True)
b = vault.list_jobs(completed=False)
print "Is In Completed List"
print archive_id in a
print "Is In NOT Completed List"
print archive_id in b
print "Is In Completed List"
print retrieve_job in a
print "Is In NOT Completed List"
print retrieve_job in b
答案 0 :(得分:4)
看看这个Boto and Glacier guide,您可以从boto手动轮询它,也可以设置Amazon Simple Notification Service以在作业完成时通知您。
archive_id = vault.upload_archive("mybackup.tgz")
retrieve_job = vault.retrieve_archive(archive_id)
# if the job is in progress
job_id = retrieve_job.id
retrieve_job = vault.get_job(job_id)
if retrieve_job.completed:
job.download_to_file("mybackup.tgz")
您可以使用boto的 set_vault_notifications 功能设置SNS通知。
notification_config = {'SNSTopic': 'my_notification_topic',
'Events': ['ArchiveRetrievalCompleted',
'InventoryRetrievalCompleted']}
vault.set_vault_notifications(vault, notification_config)
Here是通过设置SQS队列服务的SNS通知订阅来等待上传的广泛示例。