pyspark数据框保存到配置单元表找不到

时间:2019-05-15 10:30:10

标签: apache-spark hive pyspark cloudera-cdh

我们已经通过cdh6.2安装了集群。 使用pyspark创建一个dataFrame,然后将其保存到配置单元中。

该文件已在仓库中正确创建,但使用show tables在蜂巢或黑斑羚中找不到。

可以通过spark sql使用sql找到(“显示表格”)。但是它仅显示该表之前是由spark代码创建的,这意味着它看不到通过hive或impala控制台创建的表。

所以我认为它可能不会将火花代码收集到Hive Metastore服务器中。

但是我不知道如何将其设置到Hive Metastore服务器。

1 个答案:

答案 0 :(得分:0)

为了连接到Hive Metastore,您需要将hive-site.xml文件复制到spark / conf目录。请尝试以下操作:

ln -s /usr/lib/hive/conf/hive-site.xml /usr/lib/spark/conf/hive-site.xml