标签: java apache-spark dataframe garbage-collection jvm
Apache spark中的数据框使用堆内存来存储数据。 使用堆内存的主要目的是什么? 我目前理解的是存储大型对象(可变或不可变对象)是有益的,因此它不需要我们使用更大的Java堆空间。 由于Java垃圾收集器的工作原理,使用大型Java堆空间会降低应用程序的速度。
以上就是我所理解的..有人可以帮我把各个部分拼凑起来..