标签: python load pyspark gensim word2vec
我想将word2vec与PySpark一起使用来处理一些数据。 我以前在Python中使用Google训练的模型GoogleNews-vectors-negative300.bin和gensim。
有没有办法可以用Mllib / word2vec加载这个bin文件? 或者将数据作为字典从Python {word:[vector]}(或.csv文件)导出然后将其加载到PySpark中是否有意义?
由于