标签: mysql sql apache-spark dataframe apache-spark-sql
我希望基于'name'在两个表A和B上进行外连接,然后减去列'count'值,如果另一个表中不存在该行,则替换为0。有没有人知道一个简单的SQL查询来实现这一目标?
ToString
谢谢!
(或者,如果有一种方法可以使用Spark DataFrames,那也很棒!)
答案 0 :(得分:1)
使用spark,您可以将name列上的两个数据框加入coalesce null计数为零,然后用{{1}减去A.count }}:
spark
name
coalesce
null
A.count
B.count