标签: apache-spark apache-spark-sql
我目前正在探索使用Spark SQL(1.4.1)。我有3个不同的数据源(RDBMS)来在一个时间点从其中任何一个加载数据。每个RDBMS源都有不同的表结构。
为了在Spark SQL中拥有通用基础结构,我应该将RDBMS数据源导出到.CSV文件的公共表结构,然后使用Spark SQL加载吗?