数据框之间的差异

时间:2018-07-16 03:41:49

标签: apache-spark apache-spark-sql

给出两个数据框D1和D2,它们代表SQL中具有相同列和相同主键的两个表。找出两者之间差异的最佳方法是什么?

差异包括: 1. D1中的所有记录不在D2中 2. D2中的所有记录不在D1中 3. D1中的任何更新记录都与D2比较。

1 个答案:

答案 0 :(得分:1)

在DataFrame上使用left_semi,left_anti连接。

即:

RuleParamsBean.java