问题:
我目前正在使用python-recsys和SVD算法为我的用户计算推荐。计算速度相当快(目前为止),但我想知道如果我们上线会如何表现。我们有大约100万个产品存储在Mongodb中,预计将有大约100个用户启动。我模拟了这种情况,但这种随机生成的数据实际上并不适用于真实案例。
我们使用Redis进行推荐存储,它们在芹菜任务中每2小时计算一次并且目前真的很重,尽管我已经尽力优化它们。
担心未来我计划将Neo4j用于该任务,尽管很难找到使用此数据库获取建议的开发人员的真实故事。
一般来说,我想要实现的是合理工作的推荐引擎(在我猜的情况下mahout会有点过分,这不是真正的内存,因为我们买不起很多服务器。
Neo4j将如何解决这个问题?那个数据库有没有好的python驱动程序?也许它最好使用当前的Mongodb / Redis解决方案并稍微调整一下,而不是将另一个db添加到当前堆栈中?我还在考虑使用单独的机器进行纯粹的推荐计算 - 但这是一个不错的选择吗?
答案 0 :(得分:1)
担心未来我打算使用Neo4j来完成这项任务 很难找到开发人员使用的真实故事 这个db用于推荐。
http://seenickcode.com/switching-from-mongodb-to-neo4j/
Neo4j将如何解决这个问题?有没有好的蟒蛇 那个db的驱动程序?