我已经使用Watson Studio进行一些基础课程工作;是否可以将二进制形式(.bin)的Google Word矢量加载到Watson Studio中?
答案 0 :(得分:0)
您肯定可以在Watson Studio Notebook中读取二进制格式的文件以及任何类型的文件。
首先,您需要上传的二进制zip文件
将GoogleNews-vectors-negative300.bin.gz转换为Watson Studio数据资产,可以将其拖放到“文件”部分。
完成后,您可以使用project-lib
将该文件读入二进制对象。
插入项目令牌,请参考以下文档。
获取文件
my_file = project.get_file("GoogleNews-vectors-negative300.bin.gz")
因为它是gzip,所以您需要使用gzip
import gzip
gzip_f = gzip.GzipFile(fileobj=my_file)
安装gensim !pip install gensim
导入gensim
# Load Google's pre-trained Word2Vec model.
model = gensim.models.KeyedVectors.load_word2vec_format(gzip_f,binary=True)