标签: python machine-learning multiprocessing scikit-learn
在Scikit-learn中,K-Means有n_jobs,但MiniBatch K-Means缺乏它。 MBK比KMeans快,但在大型样本集中,我们希望它将处理分布在多处理(或其他并行处理库)中。
MKB的部分适合答案吗?
答案 0 :(得分:3)
我不认为这是可能的。您可以在小批量处理中使用OpenMP实现某些功能。我不知道任何并行的minibatch k-means程序。并行随机梯度下降程序有些毛茸茸。
顺便说一下,KMeans中的n_jobs参数只会分配不同的随机初始化。