如何将Spark mllib word2vec模型转换为手套txt格式?

时间:2018-12-21 23:36:29

标签: apache-spark apache-spark-mllib word-embedding glove

我使用Spark MLlib训练特定领域的word2vec模型,我需要以手套word2vec格式使用它。 如何将其转换为手套txt格式?

1 个答案:

答案 0 :(得分:0)

在SparkShell中尝试了一下之后,我发现以下代码对我有用:

val vectors = model.getVectors
val writer = new BufferedWriter(new FileWriter(file))
vectors foreach ( entry => writer.write(entry._1 + " " +   entry._2.mkString(" ") + "\n") )