标签: apache-spark apache-spark-sql
给出两个数据框D1和D2,它们代表SQL中具有相同列和相同主键的两个表。找出两者之间差异的最佳方法是什么?
差异包括: 1. D1中的所有记录不在D2中 2. D2中的所有记录不在D1中 3. D1中的任何更新记录都与D2比较。
答案 0 :(得分:1)
在DataFrame上使用left_semi,left_anti连接。
即:
RuleParamsBean.java