标签: apache-spark cassandra spark-streaming
我想处理来自RabbitMQ的数据流。具体来说,它是一个变更列表,我想过滤掉已经发生的变化。为此,我需要将新数据与Cassandra数据库中的现有数据进行比较。
在Spark流式转换中可以做到这一点吗?我应该考虑一些更惯用的方法吗?