我想使用Apache Mahout作为推荐引擎;但是在这里我发现它迫使我们使用自己的名为taste_preferences的表,只有3-4列,数据类型为数字(Long / big int)。是否必须使用此表并仅以数字格式存储数据。
答案 0 :(得分:2)
这是构建推荐引擎的一种方法,但也有更简单的方法。
有一本免费的小书
http://www.mapr.com/practical-machine-learning
解释了在搜索引擎上部署推荐引擎的方法。这需要离线分析来构建放入搜索引擎的数据,但是一旦在搜索引擎中有指标数据,就可以使用搜索查询来做推荐。这些查询不是文本查询,而是将过去的行为用作查询。
您还可以在此处查看描述该方法的幻灯片:
http://www.slideshare.net/tdunning/building-multimodal-recommendation-engines-using-search-engines
在这里:
http://www.slideshare.net/tdunning/using-mahout-and-a-search-engine-for-recommendation
这本书比没有叙述的幻灯片更容易理解,但两者都很有用,因为幻灯片有更多细节。