我们的要求是按列对phoenix表进行分区,并从SPARK覆盖分区级别的记录。
答案 0 :(得分:0)
在凤凰表中没有分区的概念,我们有盐分,它将分配数据,并且排序将是随机的。
我们可以使用spark覆盖phoenix表中的数据 df.write.format(" org.apache.phoenix.spark")。mode(" overwrite")。option(" table",tableToSave).option( "查询","选择*来自''''")。选项(" zkUrl",zkUrl )。保存() 根据条件,我们可以覆盖数据