我是Spark(Spark_SQL)的新手,我已将数据加载到spark_sql中我还创建了表并将一些数据加载到其中。
我的问题是:架构和表格数据将存储在哪里?
答案 0 :(得分:2)
存储表模式
Hive Metastore
默认是Derby数据库作为" Metastore"。您可以打开运行Spark作业的文件夹,您会注意到metastore_db
文件夹
使用Hive时,Hive Metastore是安装Hive时建立的MySQL,Postgres,Oracle数据库。
表格将存储
Hive仓库目录
HDFS /apps/hive/warehouse/<databasename>/<tablename>.db/
,例如在Hortonworks环境中。
默认的SparkSQL会将Gzipped Parquet文件保存到该目录中,作为顺序编号的part-00xyz
文件,意味着&#34;分区&#34;。