在Watson Studio中使用Google Vectors

时间:2019-03-04 20:07:32

标签: watson-studio

我已经使用Watson Studio进行一些基础课程工作;是否可以将二进制形式(.bin)的Google Word矢量加载到Watson Studio中?

1 个答案:

答案 0 :(得分:0)

您肯定可以在Watson Studio Notebook中读取二进制格式的文件以及任何类型的文件。

首先,您需要上传的二进制zip文件 将GoogleNews-vectors-negative300.bin.gz转换为Watson Studio数据资产,可以将其拖放到“文件”部分。 完成后,您可以使用project-lib将该文件读入二进制对象。

  1. 插入项目令牌,请参考以下文档。

  2. 获取文件

    my_file = project.get_file("GoogleNews-vectors-negative300.bin.gz")

  3. 因为它是gzip,所以您需要使用gzip

    import gzip

    gzip_f = gzip.GzipFile(fileobj=my_file)

  4. 安装gensim !pip install gensim

  5. 导入基因并加载模型

导入gensim

    # Load Google's pre-trained Word2Vec model.
    model = gensim.models.KeyedVectors.load_word2vec_format(gzip_f,binary=True)  

参考:-https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/project-lib-python.html?audience=wdp

完整笔记本:- https://dataplatform.cloud.ibm.com/analytics/notebooks/v2/3ea58eda-cd56-4f7a-8b73-707d4b84edb2/view?access_token=cdfedfc282a7fc98691a1e7c5c183eeac607a7d1e09656dff448c6989e52eb5a