如何根据相似性评分评估建议书?

时间:2019-05-10 13:08:28

标签: tf-idf lda cosine-similarity tfidfvectorizer

我正在构建一个推荐系统,我的主要目标是根据用户论文的标题和摘要来推荐一个会议发布场所。这是系统应该工作的方式

  1. 首先,dblp数据集将用于培训我们的推荐系统。 Dblp数据集包含论文标题,摘要,引文计数和地点名称
  2. 我同时使用LDA和TFIDF(主要用于比较)来训练DBLP数据集
  3. 经过培训,用户将假设输入论文标题和摘要
  4. 然后将输入数据与训练数据进行匹配,并为每个场所分配相关性得分(为此目的使用余弦相似度)
  5. 最后,所有最高分的地点以及相似度分会显示给用户

现在我的问题是

如何评估这种类型的技术,因为它没有任何实际分数的先验信息。如果我使用精度并回想起假阳性和假阴性是什么? 直到现在我都使用相似性阈值,即,如果场地高于0.4分,它将是有意义的,否则它将是无关紧要的吗?这种评估方法正确吗?

0 个答案:

没有答案