Spark_SQL将存储架构和表数据?

时间:2017-02-14 18:06:20

标签: hadoop apache-spark hive apache-spark-sql

我是Spark(Spark_SQL)的新手,我已将数据加载到spark_sql中我还创建了表并将一些数据加载到其中。
我的问题是:架构和表格数据将存储在哪里?

1 个答案:

答案 0 :(得分:2)

  

存储表模式

Hive Metastore

默认是Derby数据库作为" Metastore"。您可以打开运行Spark作业的文件夹,您会注意到metastore_db文件夹

使用Hive时,Hive Metastore是安装Hive时建立的MySQL,Postgres,Oracle数据库。

  

表格将存储

Hive仓库目录

HDFS /apps/hive/warehouse/<databasename>/<tablename>.db/,例如在Hortonworks环境中。

默认的SparkSQL会将Gzipped Parquet文件保存到该目录中,作为顺序编号的part-00xyz文件,意味着&#34;分区&#34;。