标签: apache-spark hive apache-spark-sql
我正在使用SparkSession连接到配置单元数据库。我试图确定什么是丰富数据的最佳方式。我使用的是Spark Sql,但我厌倦了使用它。
SparkSql是否只调用Hive Sql?那么这意味着使用Spark没有改进的性能吗?
如果没有,我应该创建一个大的SQL查询来激发,还是我应该抓住一个表,我不想将它转换为数据帧并使用sparks函数对其进行操作?
答案 0 :(得分:0)