目前Fasttext通过取句子中单词的标准化单词向量的平均值来产生句子向量。这是提出句子向量的最佳方式。
或者是否使用tfidf加权单词然后从中减去第一个PCA组件,如本文所述:https://openreview.net/pdf?id=SyK00v5xx将更好地工作。在fasttext中是否已经存在任何此类实现。如果是这样,通过python在哪里以及如何使用它。
另外,在计算快速文本向量时,是否需要从句子中删除停用词?
另外在fasttext的python绑定中如何计算句子向量。似乎没有这方面的语法。任何意见。