我试图了解Mongodb中的嵌入但是找不到足够好的文档。不建议链接,因为写入在文档中不是原子的,并且还有两个查找。有人知道如何解决这个问题,或者你建议我去看看像neo4j这样的图表。
我正在尝试构建一个需要多对多关系的应用程序。为了解释,我将以图书馆为例。它可以根据他的朋友正在阅读的书籍以及用户正在阅读的邻居(像头脑一样)来向用户推荐书籍。
有用户和书籍。用户借书和拥有其他用户的朋友
用户= [
{ name: 'xyz', 'id':'000000', friend_ids:['949583','958694']} { name: 'abc', 'id':'000001', friend_ids:['949582','111111']} ]
书籍= [
{'book':'da vinci code', 'author': 'dan brown', 'readers'=['949583', '000000']} {'book':'iCon', 'author': 'Young', 'readers'=['000000', '000001']} ]
如上所示,如果我采用mongo DB,我通常需要两个文件,因为我可以双向查找。将文档复制(嵌入)到另一个文档可能会导致大量的重复(这些模式可以存储比显示的信息更多的信息)。
我是否正确建模数据?这可以在mongodb中有效地完成,还是应该查看图dbs。
答案 0 :(得分:6)
免责声明:我为Neo4j工作
从您的大纲,要求和数据类型看,您的应用程序似乎是图形数据库的甜点。
我建议你用图表数据库快速加速,看看它是怎么回事。
一些问题:
答案 1 :(得分:5)
上面的基本架构提案适用于MongoDB,并提出一些建议:
_id
字段而不是id
,因为此字段始终存在于MongoDB中,并且在其上创建了默认的唯一索引。这意味着您的_id
始终是唯一的,_id
的查询速度非常快。你是对的,使用这种模式需要多个find()
,并且每次都会产生网络往返开销。但是,对于上面建议的每个查询,您需要的查找次数不超过2次,并结合一些简单的应用程序代码:
db.books.find({_id: {$in: [list, of, books, for, the, user]}})
查询图书集,然后是c。对于每本书,为该书的读者和用户的朋友计算一组联合$in
db.users.find({_id: {$in: [list, of, users, reading, book]}})
查找正在阅读该图书的所有用户
我应该注意,如果您有很长的列表,$in
可能会很慢,因为它实际上相当于对N个项目列表进行N次查找。但是,服务器会为您执行此操作,因此它只需要一次网络往返而不是N.
作为对某些查询使用$in
的替代方法,您可以在数组字段上创建索引,并在集合中查询数组中具有特定值的文档。例如,对于上面的查询#1,您可以执行以下操作:
// create an index on the array field "readers"
db.books.ensureIndex({readers: 1})
// now find all books for user whose id is 1234
db.books.find({readers: 1234})
这称为multi-key index,在某些情况下效果可能优于$in
。您的确切经验将根据文档数量和列表大小而有所不同。