Pyspark - 加载训练有素的模型word2vec

时间:2017-04-06 08:27:18

标签: python load pyspark gensim word2vec

我想将word2vec与PySpark一起使用来处理一些数据。 我以前在Python中使用Google训练的模型GoogleNews-vectors-negative300.bin和gensim。

有没有办法可以用Mllib / word2vec加载这个bin文件? 或者将数据作为字典从Python {word:[vector]}(或.csv文件)导出然后将其加载到PySpark中是否有意义?

由于

0 个答案:

没有答案