我有一个有3列的数据框。前两个是因子,第三个是数字。我只是从第1230行到第1250行选择数据。数据如下
> beer_ratings[1230:1250,]
beer_beerid review_profilename review_overall
1230 52211 WITTBEER 4.0
1231 52211 orbitalr0x 3.0
1232 52211 ColForbinBC 3.5
1233 52211 Heatwave33 4.0
1234 52211 StlHopHead77 4.0
1235 52211 AleWatcher 5.0
1236 52211 scruffwhor 4.0
1237 52211 polisanl 1.5
1238 52211 VncentLIFE 4.0
1239 52211 ahq514 3.5
1240 52211 SpdKilz 4.0
1241 52211 oline73 4.0
1242 52211 TheGordianKnot 3.0
1243 52211 homebrew311 4.0
1244 52211 ZeroSignal 4.0
1245 52211 drcarver 4.0
1246 52211 jzeilinger 4.0
1247 52211 JayS2629 4.0
1248 52211 superspak 4.0
1249 52211 AleWatcher 3.5
1250 52211 shortbus7 3.5
现在我将其转换为realRatingMatrix并尝试获取评级摘要
a<- as(beer_ratings[1230:1250,],"realRatingMatrix")
summary(getRatings(a))
奇怪的是,摘要如下
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.500 3.500 4.000 3.925 4.000 8.500
为什么最大值显示为8.5?
我使用的是推荐器库
答案 0 :(得分:0)
好的我明白了。用户AleWatcher对5和3.5评分相同的啤酒两次。