请根据某些事件历史告知有关预测未来事件的方法和模型。 Spark MLib或Weka机器学习库是否适用于此?
我需要解决以下问题:
输入数据:具有用户阅读历史记录的巨大(750 GB)记录集,其中记录具有以下结构:
userId, title, author, genre, date_read
任务:鉴于用户的部分阅读历史记录预测她最有可能阅读的下一个标题以及哪些内容? 更确切地说:系统必须为从数据集中所有可用标题中只读取几个标题的用户预测下一个标题的有序序列。换句话说,为刚刚开始阅读的用户预测有序的标题序列。