标签: scala apache-spark compare rdd
我试图比较从两个不同来源生成的两个文件(理想情况下,两个文件应该具有相同的数据)。它有近300个字段,并试图生成字段报告具有不同的值。能否请您建议最佳方法来识别具有不同值的字段名称的记录。 行和字段名称的值差异
我们可以使用DF / rdd对rdd或外连接使用减法转换,但也无法识别字段名称。
感谢您的帮助!
此致 Scala Learner