pyspark一对多加入操作

时间:2019-09-20 10:09:44

标签: pyspark pyspark-sql pyspark-dataframes

在pyspark数据框中
假设有dfA和dfB,

dfA : name , class
dfB : class, time

如果dfA.select('class')。distinct()。count()= n, 当n为n <100时,n> 100000,

在这两种情况下操作联接时,应如何优化联接?

0 个答案:

没有答案