应用错误收集

如何将文件加载到每个工作人员？

时间：2019-05-24 15:01:44

标签： apache-spark pyspark

我正在寻找一种分发巨大文件（8gb，即word2vec预训练嵌入）的方法，以供每个工作者使用。

事实上，我有一个程序可以计算每个文档的嵌入，作为其单词向量的总和。每个单词都有一个向量。

反正每个工作者都可以下载此文件吗？

与：How to load a file in each executor once?完全相同问候

0 个答案:

没有答案