是否有更快的方法将DynamoDB表导出到JSON文件,然后通过数据管道运行并启动EMR实例?另一方面,有一种快速的方法可以将相同的数据导入另一个表吗?
答案 0 :(得分:1)
这取决于快速的含义。如果您正在引用表导出和导入的性能,那么答案是肯定的,您可以根据您对表结构的了解来滚动自己的多线程实现并调整控制并发性的参数。
如果您指的是设置导出和导入所需的时间,那么数据管道非常快,您可能无法做得更好。
答案 1 :(得分:0)
DynamoDB最近发布了一项新功能,可将数据导出到S3存储桶。它支持DynamoDB JSON-请参阅有关如何使用它的文档:
https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/DataExport.html
如果您感兴趣的只是将数据从一个表获取到另一个表,则可以简单地使用时间点还原将数据还原到新表中-请参阅:
https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/backuprestore_HowItWorks.html