有没有人知道facebook开源的单词向量(特别是这里的https://fasttext.cc/docs/en/pretrained-vectors.html)是否包含子词向量,或者它们是否只包含生成的完整单词向量。我希望他们会包含子词,但我找不到它们,并且似乎无法在任何地方找到这个问题的明确答案。
答案 0 :(得分:1)
fastText
为您提供了两种可能的解决方案:
实际上,您可以使用.bin文件为每个想要的单词进行嵌入,而使用.vec文件,您可以使用固定数量的可用向量(数量仍然很大)。