标签: nlp word-embedding fasttext
许多单词具有多个向量,因为它们与多个大小写一起使用。但是,单词的大小写会改变其含义似乎很不寻常。我可以结合向量使每个单词只有一个向量吗?
我当时正在考虑使用加权几何中点。加权将是一个简单的线性变换,取决于不同的词频。我怎么能证明新的向量是有效的,或者它是一个很好的表示?我确定必须有其他方法。