标签: scala apache-spark cassandra
我需要一些建议来解决以下问题:
我有一个带Cassandra的Spark集群。 我需要编写一个spark作业(使用Scala)从Cassandra中提取一些信息。我需要生成一个带有结果的文件并将其放在另一台服务器上(没有Spark)。
我的问题是:最佳解决方案是什么? 1.在与spark相同的服务器上生成文件,然后执行scp将其复制到目标服务器上? 2.还有另一种方法可以在我的目标服务器上生成文件吗?
感谢。