我们已经通过cdh6.2安装了集群。 使用pyspark创建一个dataFrame,然后将其保存到配置单元中。
该文件已在仓库中正确创建,但使用show tables
在蜂巢或黑斑羚中找不到。
可以通过spark sql使用sql找到(“显示表格”)。但是它仅显示该表之前是由spark代码创建的,这意味着它看不到通过hive或impala控制台创建的表。
所以我认为它可能不会将火花代码收集到Hive Metastore服务器中。
但是我不知道如何将其设置到Hive Metastore服务器。
答案 0 :(得分:0)
为了连接到Hive Metastore,您需要将hive-site.xml文件复制到spark / conf目录。请尝试以下操作:
ln -s /usr/lib/hive/conf/hive-site.xml /usr/lib/spark/conf/hive-site.xml