应用错误收集

运行Spark App：坚持Metastore

时间：2017-07-26 15:56:33

标签： apache-spark apache-spark-sql

我在Spark 2.1应用程序上工作，该应用程序也使用SparkSQL并使用dataframe.write.saveAsTable(tbl)保存数据。我的理解是内存中的Derby DB用于Hive Metastore（对吗？）。这意味着我在第一次执行中创建的表在任何后续执行中都不可用。在许多情况下，这可能是预期的行为 - 但我希望将Metastore贯穿执行（因为这也是我在生产系统中的行为）。

所以，一个简单的问题：如何更改配置以在磁盘上保留Metastore？

一句话：我没有使用spark-shell或spark-submit启动Spark作业，而是作为一个独立的Scala应用程序。

1 个答案:

答案 0 :(得分：-1)

它已经存在于磁盘上。只要两个会话使用相同的工作目录或特定的Metastore配置，永久表就会在会话之间保持不变。

Hive Metastore位置
Spark制作本地Metastore而不是将数据存储在实际的mysql Metastore中
Configuring Spark and a standalone Hive MetaStore to persist DafaFrames to s3
如何清理运行Hive Metastore的derby实例
Spark中的HIVE Metastore警告
Spark SQL是否使用Hive Metastore？
运行Spark App：坚持Metastore
坚持比非坚持呼叫慢
Spark和Metastore关系
在Spark中更改Metastore URI

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？