比较两个rdd以识别审计字段更改和相应的字段名称

时间:2016-09-21 08:22:15

标签: scala apache-spark compare rdd

我试图比较从两个不同来源生成的两个文件(理想情况下,两个文件应该具有相同的数据)。它有近300个字段,并试图生成字段报告具有不同的值。能否请您建议最佳方法来识别具有不同值的字段名称的记录。 行和字段名称的值差异

我们可以使用DF / rdd对rdd或外连接使用减法转换,但也无法识别字段名称。

感谢您的帮助!

此致 Scala Learner

0 个答案:

没有答案