我正在学习评估文档之间的文本相似性。在有关该主题的text2vec教程(app.use)中,我注意到代码出于相似性返回了两个值。这是Dmitriy Selivanov的教程中代码的结尾:
d1_d2_cos_sim = sim2(dtm1, dtm2, method = "cosine", norm = "l2")
dim(d1_d2_cos_sim)
哪个返回值(300或200)描述文本的相似性/差异性?
答案 0 :(得分:0)
它都没有描述。 dim
仅返回d1_d2_cos_sim
矩阵的行数和列数,即300 x200。相似性位于对象d1_d2_cos_sim
中,如您在代码的下一行{{1 }}会返回前2行和前5列。这表明d1的前2个文档与d2的前5个文档相似。