所以目前我正试图弄清楚如何从MovieLense(https://grouplens.org/datasets/movielens/100k/)构建一个电影推荐系统。我从教程中读到了一些说明。
library(dplyr)
library(recommenderlab)
library(magrittr)
data <- read.table("u.data", header = F, stringsAsFactors = T)
head(data)
V1 V2 V3 V4
1 196 242 3 881250949
2 186 302 3 891717742
3 22 377 1 878887116
4 244 51 2 880606923
5 166 346 1 886397596
6 298 474 4 884182806
说明:V1
是userid,V2
是itemid,V3
是评级
现在我需要将格式记录到ratingMatrix,结果将如下:
1 2 3 4 5 6 7 8 9 10
1 5 3 4 3 3 5 4 1 5 3
2 4 NA NA NA NA NA NA NA NA 2
3 NA NA NA NA NA NA NA NA NA NA
4 NA NA NA NA NA NA NA NA NA NA
5 4 3 NA NA NA NA NA NA NA NA
6 4 NA NA NA NA NA 2 4 4 NA
7 NA NA NA 5 NA NA 5 5 5 4
8 NA NA NA NA NA NA 3 NA NA NA
9 NA NA NA NA NA 5 4 NA NA NA
10 4 NA NA 4 NA NA 4 NA 4 NA
代码:
temp = data %>% select(1:3) %>% spread(V2,V3) %>% select(-1)
temp[1:10,1:10]
传播错误(。,V2,V3):无法找到功能&#34;传播&#34;
答案 0 :(得分:3)
尝试将library(dplyr)
替换为library(tidyverse)
。 spread
函数现在位于tidyr
包中,该包是tidyverse
和dplyr
的一部分。