EMR和Scan都会解析整个表并消耗请求信用,但EMR也需要使用ec2实例,因此花费更多。
所以,我想知道在哪种情况下EMR比在亚马逊的Dynamo-DB上扫描更适合?
答案 0 :(得分:2)
抱歉 - 我不完全确定我理解你的问题。
如果您问为什么要使用EMR扫描整个DynamoDB表而不是直接进行扫描,答案就是速度和简单性。
如果你使用DynamoDB Serde之类的Hive,你可以比直接查询DynamoDB更快地提取DynamoDB表的全部内容,因为扫描将被并行化。
DynamoDB支持一致的读取性能,因此在查询DynamoDB表时,瓶颈会转移到能够足够快速读取数据的客户端。