为三角洲湖中的表创建索引

时间:2019-10-23 16:46:10

标签: apache-spark indexing delta-lake

我是Delta Lake的新手,但是我想创建一些索引以快速检索Delta Lake中的某些表。根据文档,它表明最接近的是通过创建“数据跳过”然后索引跳过的部分:

ApiKeyScheme

除了数据跳过外,似乎找不到其他创建索引的方法

如何在Delta Lake中像在RDBMS中创建任何表一样创建索引?

谢谢!

1 个答案:

答案 0 :(得分:1)

索引发生automatically on Databricks Delta。写入数据时,将对所写入文件中的列建立索引并将其添加到内部表元数据中。查询数据和过滤时,将应用数据跳过。

此外,您可以使用z-order根据特定列优化文件。同样,索引仍将用于其他列。