在Spark Streaming测试中使用Spark Cassandra连接器时如何模拟Cassandra的数据?

时间:2019-01-07 06:12:59

标签: scala apache-spark spark-cassandra-connector

我有一个完全用scala编写的代码,该代码使用spark流从kafka主题获取json数据,然后在进行一些处理后将其转储到cassandra和另一个kafka主题。现在,我需要为此代码编写一个单元测试。我需要有关如何编写这样的测试以及在使用spark cassandra连接器时如何模拟数据的帮助。

1 个答案:

答案 0 :(得分:0)

您可以使用与连接器本身一起开发的spark-cassandra-connector-embedded。只需将Maven或SBT依赖项添加到您的项目中,例如SBT:

"com.datastax.spark"  %% "spark-cassandra-connector-embedded" % {latest.version}