与插入插入相反,未记录的批次可在插入保留在同一分区内时提高性能。
如果表t1
和t2
分享相同的分区键,那么该怎么办?当批处理是t1
和t2
的混合时,同样的规则适用插入吗
这意味着相应的t1
和t2
分区存储在同一节点上 - link
答案 0 :(得分:2)
如果分区键是相同的,它将路由到相同的副本,所以是的,如果发送到右协调器,它将没有额外的网络跃点。但它仍然需要将它们分别应用到不同的记忆中。
批处理很有意思,即使所有在同一个分区中,它也会限制它会损害性能的位置,它在很大程度上取决于数据模型。如果批处理在你的应用程序中产生巨大的差异,那么你的吞吐量很可能由延迟(littles法则)决定,在这种情况下,使查询/处理异步也可以提供帮助,并且可以提供可预测的结果。