标签: scikit-learn pyspark
我试图通过调用Spark Python API来实现scikit-learn Extra树分类器算法。由于Spark适用于RDD,而scikit算法只需要数组,矩阵或数据帧,因此我遇到了sparkit learn(https://pypi.python.org/pypi/sparkit-learn)。但是,我并不了解分支和块的概念,这些分区和块可以使用。