如何在Databricks Delta Multi Cluster环境中维护主键列

时间:2019-08-25 11:41:32

标签: apache-spark pyspark apache-spark-sql databricks azure-databricks

我正在尝试复制类似于SQL DB的功能,即在将数据写入Blob存储(例如ADLS2或AWS S3)的Databrciks Delta方法中维护主键。

我想要使用Databricks Delta的自动增量主键功能。

现有方法-是使用最新的行数并维护主键。但是,这种方法不适用于主键获取重复数据的并行处理环境。

0 个答案:

没有答案