推荐引擎用于简单但数据量很大的Web应用

时间:2014-11-03 14:33:52

标签: python mongodb neo4j recommendation-engine

问题:

我目前正在使用python-recsys和SVD算法为我的用户计算推荐。计算速度相当快(目前为止),但我想知道如果我们上线会如何表现。我们有大约100万个产品存储在Mongodb中,预计将有大约100个用户启动。我模拟了这种情况,但这种随机生成的数据实际上并不适用于真实案例。

我们使用Redis进行推荐存储,它们在芹菜任务中每2小时计算一次并且目前真的很重,尽管我已经尽力优化它们。

担心未来我计划将Neo4j用于该任务,尽管很难找到使用此数据库获取建议的开发人员的真实故事。

一般来说,我想要实现的是合理工作的推荐引擎(在我猜的情况下mahout会有点过分,这不是真正的内存,因为我们买不起很多服务器。

Neo4j将如何解决这个问题?那个数据库有没有好的python驱动程序?也许它最好使用当前的Mongodb / Redis解决方案并稍微调整一下,而不是将另一个db添加到当前堆栈中?我还在考虑使用单独的机器进行纯粹的推荐计算 - 但这是一个不错的选择吗?

1 个答案:

答案 0 :(得分:1)

  

担心未来我打算使用Neo4j来完成这项任务   很难找到开发人员使用的真实故事   这个db用于推荐。

http://seenickcode.com/switching-from-mongodb-to-neo4j/

  

Neo4j将如何解决这个问题?有没有好的蟒蛇   那个db的驱动程序?

http://neo4j.com/developer/python/