应用错误收集

pyspark一对多加入操作

时间：2019-09-20 10:09:44

标签： pyspark pyspark-sql pyspark-dataframes

在pyspark数据框中
假设有dfA和dfB，

dfA : name , class
dfB : class, time

如果dfA.select（'class'）。distinct（）。count（）= n，当n为n <100时，n> 100000，

在这两种情况下操作联接时，应如何优化联接？

0 个答案:

没有答案