应用错误收集

数据信息：

群集信息：

你的任务：groupBy(theGroup)使用Spark， iff ，这不会太长。

大问题：对此操作需要多长时间 T 的估计是什么？

到目前为止的疯狂猜测：我想 T 是：

增加 N （ n.E ） - 1 log（ N （ n.E ）-1）
- idea：因为每个节点上都有 N （ n.E ） - 1行，它们可能必须先排序
增加 b ，显然是
增加 pingTime
增加 G ，但我不知道如何： G ²增加 G ＆lt; Ñ
减少 n

我需要估算 T 的幅度顺序，但我仍然缺少术语（例如 E 和 G 之间的关系）。