我们应根据什么依据来选择Dataframe中重新分区的分区数?

时间:2019-05-17 01:33:34

标签: pyspark apache-spark-sql

在基于内存核心对数据帧进行重新分区时,我们应基于什么基础来决定分区的数量?值应基于可用核心数或可用核心数的倍数?

0 个答案:

没有答案