VSM(向量空间模型)有哪些不同类型?
我所知道的(根据维基)是tf-idf
(在这种方法中使用余弦相似性,但它不是一个单独的方法)。还有其他方法吗?
在wiki中讨论的文档中的单词的不同维度(频率除外)是什么?
VSM是否有任何层次结构?
P.S。如果我在任何地方都错了,请纠正我......
答案 0 :(得分:1)
看看论文The Hacker's Handbook: The Strategy Behind Breaking into and Defending Networks - 对语义的向量空间模型的调查。 有关频率的特定问题,请参阅第4.2和4.3节:简而言之,使用tf-idf,PMI,PPM进一步平滑(主要是通过SVD的某些变化)。
但是,由于此调查的日期是2010年,因此没有提及基于深度学习的VSM,请参阅From Frequency to Meaning: Vector Space Models of Semantics。