标签: apache-spark apache-spark-sql
我想了解动态过滤的工作原理。 我所知道的是,说有2个表A(具有百万行)和B(具有1万行)。 现在,如果在B上应用谓词,则在A和B之间执行联接时,通过动态过滤,我们可以避免对A进行完全扫描。 这有助于减少混洗的数据。 我的问题是: