AWS Lambda w / Dynamo DB上的Python UUID(概念)

时间:2016-02-25 11:13:30

标签: python amazon-web-services amazon-dynamodb aws-lambda

这是一个概念问题:

我们希望在AWS Lambda上运行代码时为Dynamo数据库表创建唯一的主键。

如果我们在AWS Lambda上使用内置函数uuid创建一个发电机数据库数据库的唯一密钥,那么它有可能创建一个密钥的两倍,如果我们有例如500亿到100亿个项目我们的dynamodb数据库。

我知道,例如,双uuid键的正常应用中的可能性极低,几乎不可能。

据我所知,每次uuid运行时,都要确保它不能通过在内存中保存一些先前的值来创建一个double。

但是我不确定Lambda是否只是使用相同的python控制台反复运行下面的函数(并保存uuid以确保其唯一)或者是否创建多个单独的控制台实例并单独运行它们(不是拯救uuid的记忆)。

虽然这是一个概念问题,但这里有一些示例代码:

from __future__ import print_function
from decimal import *
import boto3
import json
from locale import str
import uuid

def my_handler(event, context):
    description = event['description'] 
    spot_id = uuid.uuid4() #Unique identifier for spot 
    dynamodb = boto3.client('dynamodb')
    tablesinfo = "sinfo"
    dynamodb.put_item(
    TableName = tablesinfo, Item = {
      'spot_id':{'S' : str(spot_id)},
      'description': {'S' : description}
      }
    )
    return {'spot_id' : spot_id}

1 个答案:

答案 0 :(得分:4)

Amazon AWS有自己的示例,用于在Lambda中使用Python创建UUID并将其存储在elasticache中。亚马逊没有明确表示每次都会明确地创建一个唯一的条目,但您可以将其与检查结合起来,以确定在插入之前生成的UUID是否已经在DynamoDB中。检查UUID是否已存在的缺点是,这将使用DynamoDB表上的一些读取容量,因此从概念上讲这是一个成本。

这里是来自AWS的代码,如果您调整此代码以适应DynamoDB并检查是否已在表中创建了UUID,那么这将起作用:

来自:Amazon Lambda Documentation - Create a Lambda Function example

from __future__ import print_function
import time
import uuid
import sys
import socket
import elasticache_auto_discovery
from pymemcache.client.hash import HashClient

#elasticache settings
elasticache_config_endpoint = "your-elasticache-cluster-endpoint:port"
nodes = elasticache_auto_discovery.discover(elasticache_config_endpoint)
nodes = map(lambda x: (x[1], int(x[2])), nodes)
memcache_client = HashClient(nodes)

def handler(event, context):
    """
    This function puts into memcache and get from it.
    Memcache is hosted using elasticache
    """

    #Create a random UUID... this will the sample element we add to the cache.
    uuid_inserted = uuid.uuid4().hex
    #Put the UUID to the cache.
    memcache_client.set('uuid', uuid_inserted)
    #Get item (UUID) from the cache.
    uuid_obtained = memcache_client.get('uuid')
    if uuid_obtained == uuid_inserted:
        # this print should go to the CloudWatch Logs and Lambda console.
        print ("Success: Fetched value %s from memcache" %(uuid_inserted))
    else:
        raise Exception("Value is not the same as we put :(. Expected %s got %s" %(uuid_inserted, uuid_obtained))

    return "Fetched value from memcache: " + uuid_obtained