在Spark流式传输中使用咖啡因缓存

时间:2018-07-18 21:34:52

标签: apache-spark caching spark-streaming caffeine

我正在使用CaffeineAsyncLoadingCache来缓存数据库中的查找数据。

现在,我想将其集成到Spark Streaming中。我的想法是让每个工作人员以给定的刷新率维护这样的缓存。但是该怎么做?

将其定义为广播变量并在每次超时时重新创建它并在工作人员中传播是否更好?

这里的最佳做法是什么?

0 个答案:

没有答案