寻找一个从dynamodb中检索500个项目的简单示例,从而最大限度地减少查询次数。我知道有一个“多功能”功能可以让我将其分解为50个查询,但不知道如何执行此操作。
我从一个500键的列表开始。我正在考虑编写一个函数,它接受这个键列表,将其分解为“块”,检索值,将它们重新拼接在一起,然后返回500个键值对的字典。
或者有更好的方法吗?
作为必然结果,我之后如何“排序”这些项目?
答案 0 :(得分:11)
根据您的计划,有两种方法可以有效地检索您的500件物品。
hash_key
range_key
下
query
方法与hash_key
range_keys
A-Z或Z-A BatchGetItem
方法在实践方面,由于您使用Python,我强烈建议Boto library进行低级访问,或dynamodb-mapper library进行更高级访问(免责声明:我是dynamodb的核心开发人员之一)映射器)。
可悲的是,这些库都没有提供一种简单的方法来包装batch_get操作。相反,有一个scan
生成器和query
生成器,它可以“假装”您在一个查询中获得所有内容。
为了通过批量查询获得最佳结果,我建议使用此工作流程:
UnprocessedKeys
重新提交我假设你创建了一个带有hash_key
import boto
# Helper function. This is more or less the code
# I added to devolop branch
def resubmit(batch, prev):
# Empty (re-use) the batch
del batch[:]
# The batch answer contains the list of
# unprocessed keys grouped by tables
if 'UnprocessedKeys' in prev:
unprocessed = res['UnprocessedKeys']
else:
return None
# Load the unprocessed keys
for table_name, table_req in unprocessed.iteritems():
table_keys = table_req['Keys']
table = batch.layer2.get_table(table_name)
keys = []
for key in table_keys:
h = key['HashKeyElement']
r = None
if 'RangeKeyElement' in key:
r = key['RangeKeyElement']
keys.append((h, r))
attributes_to_get = None
if 'AttributesToGet' in table_req:
attributes_to_get = table_req['AttributesToGet']
batch.add_batch(table, keys, attributes_to_get=attributes_to_get)
return batch.submit()
# Main
db = boto.connect_dynamodb()
table = db.get_table('MyTable')
batch = db.new_batch_list()
keys = range (100) # Get items from 0 to 99
batch.add_batch(table, keys)
res = batch.submit()
while res:
print res # Do some usefull work here
res = resubmit(batch, res)
# The END
编辑:
我在Boto开发分支added a resubmit()
function到BatchList
。它极大地简化了工作流程:
BatchList
submit()
resubmit()
只要它不返回无。这应该在下一个版本中提供。