手套字嵌入支持的语言

时间:2019-02-18 11:54:26

标签: nlp stanford-nlp word-embedding

最近,我开始阅读有关NLP的更多信息,并开始阅读Python后续教程,以了解有关该主题的更多信息。我也开始尝试单词嵌入,并且发现了一些有趣的结果,这些结果我不知道如何解释。我首先使用英语语料库进行培训和测试,然后,我使用英语语料库进行培训,然后使用法语小语料库进行测试(所有语料库均已标注了相同的二进制分类任务)。在这两种情况下,我都使用了预训练的推特手套嵌入。在我还使用法语语料库的情况下的结果有所改善(提高了近5%,达到〜准确度= 0.8),我想知道格洛夫是否接受过多语言数据的培训,因为我没有看到有人发表这一声明(我例如,与嵌入不同语言的语言相比,“我知道使用的数据量)。

此外,如果Glove支持多语种信息,那么这也将不需要将不同的单词嵌入映射到相同的嵌入空间中(对于FastText就是这种情况)。

任何澄清将不胜感激。

0 个答案:

没有答案