标签: apache-spark apache-spark-sql
我有一个用例来处理像作业这样的简单ETL。数据量非常大 更少(少于几个GB),并且可以轻松地适合我正在运行的Java应用程序的 记忆。我想利用Spark数据集API,但不需要 任何火花设置(独立/群集)。我可以在现有的Java中嵌入火花吗 应用程序仍在使用吗?
我听说本地火花模式仅用于测试。对于像这样的小数据集,可以 这个还在生产中使用吗?请咨询是否有任何不利之处。
问候 雷迪