有很多关于如何在Java中调整垃圾收集器的示例。它通常通过传递命令来完成,例如-XX:+UseParallelGC -XX:+UseParallelOldGC
。如何在PySpark中调整GC?
答案 0 :(得分:0)
由于您使用spark-dataframe标记了问题,答案非常简单 - 不需要进行垃圾收集调整,即使有,也通常使用Java GC选项。
理解原因:
DataFrame
主要是一个Java对象,只有驱动程序才会出现Python包装器 - 除了用户定义的函数之外,数据和SQL操作并没有真正击中Python解释器。