这个问题可能重复,但我在StackOverflow上找不到答案。
有没有办法生成具有其他数量维度的文档向量,例如25而不是300?我还检查了spacy文档,但找不到答案。
谢谢!
答案 0 :(得分:0)
spaCy中的文档和单词向量不是由spaCy生成的,它们实际上是由大型语料库构建的预训练嵌入。有关嵌入的详细信息,您可以在文档中查看Word Vectors and Semantic Similarity。
如果你想使用自己的25维嵌入,你可以follow the instructions here。 SpaCy不会为您训练新的嵌入物,因为我建议gensim。