应用错误收集

我对spark有一个非常基本的了解，我正在努力寻找可以帮助我实现以下目标的东西：

在所有节点上异步共享一个对象池。

我现在想的是，假设有十个节点从1到10编号如果我有一个对象，我将必须使我的对象同步，以便任何节点都可以访问它。我不要那个。第二个选择是，我可以有一个说10个对象的池。我想以这样的方式编写我的代码：节点号1总是使用对象号1，节点号2总是使用对象号2等等。

在执行任务之前，示例方法是获取线程ID并使用对象编号（threadID％10）。这会导致很多碰撞而无法正常工作。

有没有办法可以以某种方式获取nodeID或processID，并使我的代码根据该ID获取对象？或者在我的集群上有一个异步的对象池的其他方法？

如果这听起来微不足道，我道歉，我刚刚开始，在网上找不到与我怀疑相关的大量资源。

PS：如果重要的话，我正在使用SparkStreaming + Kafka + YARN设置。