标签: apache-spark caching spark-streaming caffeine
我正在使用Caffeine的AsyncLoadingCache来缓存数据库中的查找数据。
AsyncLoadingCache
现在,我想将其集成到Spark Streaming中。我的想法是让每个工作人员以给定的刷新率维护这样的缓存。但是该怎么做?
将其定义为广播变量并在每次超时时重新创建它并在工作人员中传播是否更好?
这里的最佳做法是什么?