使用的数据是根据用户是否访问过网站的某个部分,从简单的0-1是/否点击数据生成的评级矩阵。这是隐式投票,因为如果用户对某个部分感兴趣,他将点击它并因此将其评级为“1”并且如果不将其评级为“0”。因此,在删除没有用户访问的9后,评级矩阵在行中有32711个用户,列中有285个站点部分。
我跑:
library("recommenderlab")
ratingmatrix <- read.csv("ratingmatrix3.txt",",",header=TRUE, row.names=1 )
ratingmatrix <- as.matrix(ratingmatrix)
ratingmatrix <- as(ratingmatrix, "realRatingMatrix")
Rec1 <- Recommender(ratingmatrix[1:1000], method="POPULAR")
pred1 <- predict(Rec1, ratingmatrix[1001:1011], type="ratings")
as(pred1,"matrix")[,1:10]
我只得到一个带有NAs的预测矩阵,暗示没有做出任何预测。它与任何其他方法相同;使用上面的POPULAR。
推荐器只能处理更密集的矩阵吗?有没有人对如何处理0-1票的矩阵有任何想法,而且没有NAs?感谢。
输出:
South.Africa Site.Builder.Workshop Netherlands..Holland. Europe
11001 NA NA NA NA
11002 NA NA NA NA
11003 NA NA NA NA
11004 NA NA NA NA
11005 NA NA NA NA
11006 NA NA NA NA
11007 NA NA NA NA
11008 NA NA NA NA
11009 NA NA NA NA
11010 NA NA NA NA
11011 NA NA NA NA
Microsoft.Solution.Providers Microsoft.Financial.Forum For.Developers.Only.News
11001 NA NA NA
11002 NA NA NA
11003 NA NA NA
11004 NA NA NA
11005 NA NA NA
11006 NA NA NA
11007 NA NA NA
11008 NA NA NA
11009 NA NA NA
11010 NA NA NA
11011 NA NA NA
Visual.Fox.Pro.Support Educational.Services...Programs Chile
11001 NA NA NA
11002 NA NA NA
11003 NA NA NA
11004 NA NA NA
11005 NA NA NA
11006 NA NA NA
11007 NA NA NA
11008 NA NA NA
11009 NA NA NA
11010 NA NA NA
11011 NA NA NA