我想在Spark Executor和C ++进程之间共享数据。除了将数据作为文件存储在内存FS中,如Tachyon / IgniteFS,还有其他有效的方法吗?
答案 0 :(得分:0)
Ignite为Spark提供了存储执行结果的能力,并在共享RDD调用IgniteRDD中的不同火花作业之间共享它们。
简而言之,IgniteRDD是一个分布式命名缓存,可以使用基本的cache.get类似操作直接访问。这意味着如果您使用Ignite C++,您可以使用基本缓存API与IgniteRDD使用的此类缓存进行交互。