Fasttext文档嵌入python

时间:2017-07-05 18:01:22

标签: python vector fasttext

目前Fasttext通过取句子中单词的标准化单词向量的平均值来产生句子向量。这是提出句子向量的最佳方式。

或者是否使用tfidf加权单词然后从中减去第一个PCA组件,如本文所述:https://openreview.net/pdf?id=SyK00v5xx将更好地工作。在fasttext中是否已经存在任何此类实现。如果是这样,通过python在哪里以及如何使用它。

另外,在计算快速文本向量时,是否需要从句子中删除停用词?

另外在fasttext的python绑定中如何计算句子向量。似乎没有这方面的语法。任何意见。

0 个答案:

没有答案