应用错误收集

使用AWS步骤函数处理大量数据？

时间：2017-12-26 17:09:15

标签： amazon-web-services architecture aws-lambda aws-batch

我们希望使用AWS步骤功能处理CSV文件中的大量数据，但我们不确定这是否是最佳选择。

我们的用例如下： - 我们上传了一个包含大量行（如50K）的CSV，每行我们处理一个小的traitements（每个traitement由lambda函数处理）。目前，我们认为最好的选择是在DynamoDB中插入CSV中的每一行，并为每一行启动lambda函数。

你怎么看待这个？

1 个答案:

答案 0 :(得分：1)

使用Lambda处理大型文件有多种模式。

一种方法是使用Lambda函数来拆分大文件并将部件委托给worker Lambda函数。
如果部件的处理步骤足够复杂，您可以触发多个步骤功能工作流程。

在您提出的方法中，如果每个项目处理足够大，那么逐项处理是有意义的，但通常以批量处理更有效。