我如何分发minibatch kmeans(scikit-learn)的处理?

时间:2013-06-11 20:48:31

标签: python machine-learning multiprocessing scikit-learn

在Scikit-learn中,K-Means有n_jobs,但MiniBatch K-Means缺乏它。 MBK比KMeans快,但在大型样本集中,我们希望它将处理分布在多处理(或其他并行处理库)中。

MKB的部分适合答案吗?

1 个答案:

答案 0 :(得分:3)

我不认为这是可能的。您可以在小批量处理中使用OpenMP实现某些功能。我不知道任何并行的minibatch k-means程序。并行随机梯度下降程序有些毛茸茸。

顺便说一下,KMeans中的n_jobs参数只会分配不同的随机初始化。