我正在尝试构建一个推荐引擎,因为我正在考虑使用apache mahout但我无法确定mahout是实时处理数据还是在服务器空闲时预处理数据将结果存储在数据库中的某个位置。
也有人知道亚马逊,netflix这样的网站会采用什么方法吗?
答案 0 :(得分:2)
两者之一,或者两者兼而有之。旧项目中的部分内部基本上是适度规模的实时部分。还有基于Hadoop的实现,它们都是脱机的。这两者没有关系。
我是这些部分的主要创建者,如果你想要一个同时兼顾的系统,我建议你看看我目前的项目Myrrix(http://myrrix.com)