快速文本维基训练矢量中的子词信息

时间:2018-02-06 19:42:14

标签: fasttext

有没有人知道facebook开源的单词向量(特别是这里的https://fasttext.cc/docs/en/pretrained-vectors.html)是否包含子词向量,或者它们是否只包含生成的完整单词向量。我希望他们会包含子词,但我找不到它们,并且似乎无法在任何地方找到这个问题的明确答案。

1 个答案:

答案 0 :(得分:1)

fastText为您提供了两种可能的解决方案:

  1. 使用仅包含词嵌入向量的.vec文件
  2. 使用还包含子词向量和模型参数的.bin文件。

实际上,您可以使用.bin文件为每个想要的单词进行嵌入,而使用.vec文件,您可以使用固定数量的可用向量(数量仍然很大)。