应用错误收集

我是Spark和SparkJob Server的初学者。

问题

我以为我可以使用Spark Cluster，但我有一种困惑。如果我编写一个查询来获取spark中的唯一用户（在集群模式下），它是否会在每个节点中单独处理并获取数字并发送给master或Master将获取所有日志文件并作为一个上下文读取并获取计数。。？

因为如果在每个节点中单独处理日志文件，它可能会给出错误的计数。