我是Delta Lake的新手,但是我想创建一些索引以快速检索Delta Lake中的某些表。根据文档,它表明最接近的是通过创建“数据跳过”然后索引跳过的部分:
ApiKeyScheme
除了数据跳过外,似乎找不到其他创建索引的方法
如何在Delta Lake中像在RDBMS中创建任何表一样创建索引?
谢谢!
答案 0 :(得分:1)
索引发生automatically on Databricks Delta。写入数据时,将对所写入文件中的列建立索引并将其添加到内部表元数据中。查询数据和过滤时,将应用数据跳过。
此外,您可以使用z-order根据特定列优化文件。同样,索引仍将用于其他列。