R的推荐器包中的Jaccard相似度计算

时间:2014-06-26 04:39:15

标签: r similarity collaborative-filtering

参数' alpha'的作用是什么?在推荐用户R包中使用Jaccard方法在推荐用户偏好矩阵的推荐模型中?即

method="Jaccard",param=list(...,alpha=0.5)

我看到了IBCF的代码,他们使用了相异功能。但是这个功能没有在官方CRAN PDF中为推荐器包定义。有人可以帮忙吗?

2 个答案:

答案 0 :(得分:0)

这是推荐器中定义的功能。尝试:

library("recommenderlab")
? dissimilarity

答案 1 :(得分:0)

来自文档:

'''

"的Jaccard&#34 ;: 两个元素中出现的项目数除以元素中的项目总数(Sneath,1957)。此度量通常也称为:二进制,非对称二进制等。

'''

基本上,Jaccard =#(0 | 0)+#(1 | 1)相似度/总数。

总计是#(0 | 0)+#(1 | 1)+#(1 | 0)+#(0 | 1)...即总行数。 #我的意思是匹配数,比如SQL中的COUNT。还有我的烟斗,| ,意思是两列之间的分隔符。

我不得不先做?不同之处,正如文档的作者Michael Hahsler所推荐的那样(呐喊!),然后转到相似{arules}文档,它简要描述了在推荐器(余弦,皮尔逊和jaccard)中使用的相异度计算,以及其他人。

Re:alpha ...看起来像是用于帮助调整与极受欢迎的项目相关的偏见:https://stats.stackexchange.com/questions/104811/what-does-the-parameter-alpha-do-in-the-jaccard-method-for-binaryratingsmatri