Hive是否可以从Delta Lake文件格式读取数据?

时间:2019-11-22 22:19:04

标签: apache-spark hive

我开始浏览DELTA LAKE文件格式,蜂巢能够从这种新引入的delta文件格式读取数据吗?如果可以的话,请让我知道您使用的Serde。

1 个答案:

答案 0 :(得分:1)

Hive支持可用于Delta Lake文件格式。首先,步骤是在我们的配置单元路径中添加https://github.com/delta-io/connectors中的罐子。然后使用以下格式创建表。 创建外部表test.dl_attempts_stream ( ... ) 由'io.delta.hive.DeltaStorageHandler'存储 位置

默认情况下,Delta格式会选择分区,因此在创建表时无需提及分区。

注意:如果通过Spark作业插入数据,请提供hive-site.xml,并在Spark作业中提供enableHiveSupport,以在Hive中创建Delta Lake表。