我有一个fifo队列,它为lambda触发了该触发器,并且这个fifo队列没有其他使用者。
我希望我的lambda不接收任何重复,因为我要确保我的消息具有唯一标识,并且已启用基于内容的重复数据删除,以确保没有重复。但是正如文档所述
Amazon SQS FIFO队列确保处理顺序遵循消息组内的消息顺序。但是,当用作Lambda触发器时,它不能保证仅一次交付。如果在无服务器应用程序中仅一次交付很重要,则建议使功能成为幂等。您可以使用可扩展的,低延迟的控制数据库(如Amazon DynamoDB)跟踪消息的唯一属性来实现此目标。
这是否意味着即使启用了重复数据删除功能,我也会收到lambda的重复副本,而lambda却是fifo队列的唯一使用者?
答案 0 :(得分:5)
这里似乎有两件事正在发生,您似乎正在混在一起。
一方面,存在SQS的 交付模型 。对于SQS FIFO队列,您正确地注意到它启用了完全一次传递。
另一方面,有Lambda函数的 执行模型 。执行模型是至少一次。顺便说一下,这与任何并发设置无关。
Lambda可能多次执行一个函数有多个原因。最值得注意的是,Lambda具有独立于SQS FIFO队列的内置重试功能。取决于可能发生的错误类型以及Lambda代码具有什么样的外部可观察到的副作用,您可能会看到您的代码对于一次实际调用会运行多次。
也就是说,还有其他原因导致发送到SQS FIFO队列的消息可能最终被Lambda处理超过一次。例如,如果您的Lambda函数花费比队列或消息的VisibilityTimeout设置更长的时间来完成对接收到的整个批处理的处理,则所有这些消息将在队列中再次变为可见,并再次调用Lambda函数将会(当然,不仅仅是“可能”)再次收到这些消息。
因此,最重要的是:您需要在Lambda中编写幂等代码-不是因为SQS FIFO(它确实可以防止重复发送),而是因为Lambda重试以及使消息再次可见的潜力由于处理速度慢(总是至少一次执行模型)而排在队列中。
答案 1 :(得分:0)
即使您只有一个lambda函数作为使用者,取决于lambda函数的并发设置,也可以有多个调用。这意味着在给定的时间,多个调用可以选择SQS队列中的消息。
一个简单的解决方法是将lambda函数的并发设置为1,以便在给定的时间仅允许一次调用。因此,队列中的消息将按顺序处理。
(但是,如果队列中有大量要处理的消息,则会导致瓶颈。)