我在Amazon EMR上使用Apache Hive将一些数据从Amazon DynamoDB批量下载到Amazon S3。我收到了以下警告:
警告:配置了dynamodb表JobDetails的写入吞吐量 小于集群映射容量。 ClusterMapCapacity:20 WriteThroughput:5
警告:写入此表可能会导致a 在桌子上写下停电。
我认为WriteThroughput
与我的DynamoDB表的配置有关。
这个警告意味着什么? ClusterMapCapacity
与我的EMR群集有关吗?
这个警告是我应该解决的问题,还是我可以忽略它?
答案 0 :(得分:0)
是的,你应该解决这个问题。
最多可以同时向表中写入20个映射作业,而表每秒只接受5个写入请求。
因此,您需要在表上至少具有20个写入容量(如果映射可以每秒写入多次,则需要更多)以避免限制(限制意味着数据可能会丢失)。