标签: optimization text hdf5 binaries
我想在大学提供的hpc集群上训练我的word2vec模型。但是,有人告诉我,为了优化群集上的存储,我必须将数据转换为HDF5并将其上传到群集中。我的数据包括txt文件(基本上是我想训练word2vec的txt文件)。我应该如何将txt文件转换为HDF5?
我正在浏览documentation,但似乎找不到用于txt文件的工具,还是应该编写特定的脚本?