词频逆文档频率和词相似度

时间:2019-11-25 20:58:25

标签: tf-idf

我要问的是tf-idf和单词相似度,问题是如何使用tf-idf来修饰单词相似度模型中的术语(不是文档相似度而是单词相似度),以便进行度量拟议的单词相似度模型是术语-术语矩阵,该矩阵的每一列均表示为(术语)单词/上下文,每一行是一个单词(目标单词),术语-术语矩阵并不重视“文档” ,我们不再拥有文档,而拥有单词实例及其上下文,而tf-idf则取决于将语料库划分为document。 术语-术语矩阵模型取自本书: (语音和语言处理,Daniel Jurafsky和James Martin)

0 个答案:

没有答案