为什么word2vec只对Word2Vec.scala中的mapPartitionsWithIndex执行一项任务:323

时间:2017-06-16 07:38:06

标签: scala apache-spark apache-spark-mllib word2vec

我正在火花中运行 word2vec ,当涉及到fit()时,在UI中只会观察到一个任务,如图像中所示:

enter image description here

根据配置num-executors = 1000, executor-cores = 2。 RDD合并到2000个分区。 mapPartitionsWithIndex需要相当长的时间。它可以分发给多个执行者或任务吗?

1 个答案:

答案 0 :(得分:6)

setNumPartitions(numPartitions: Int)解决了我的问题。我没有检查默认值。 设置分区数(默认值:1)。