我在Ubuntu环境下使用PHP和MySQL作为社交网络系统。
我有一个名为user_feed
的MySQL表,在这个表中我将feed保存为每个用户的feed_id,我的MySQL表结构是:
|user_feed_id | user_id | content_id | seen |
我有表user_follow
,其中包含每个用户后跟的数据,因此每个用户都有他/她所关注内容的记录集。
表格结构:
follow_id | user_id | content_id |
在user_feed表中,我有超过1.7亿条记录,每个用户都有一组记录,在user_follow
表中我有超过500 000条记录。
我目前正在努力从MySQL迁移到MongoDB。所以我需要将此表转换为MongoDB中的集合。我想为user_feed
和user_follow
构建我的收藏集如下:
为每个用户创建集合,此集合有三个文档,一个用于follow id,另一个用于feed_ids,因此当我处理用户配置文件时,我将为每个成员运行一个集合的查询:
每个集合名称都引用user_id,如:
user_id_1 as collection name
{ user_id: '1'}
{
feed_ids: [
{ content_id: '10', 'seen' : 1 },
{ content_id: '11', 'seen' : 0 },
{ content_id: '12', 'seen' : 1 },
{ content_id: '13', 'seen' : 1 }
]
}
{
follow_ids: [
{ content_id: '10' },
{ content_id: '20'},
{ content_id: '23'},
{ content_id: '24'}
]
}
user_id_2 as collection name
{ user_id: '2'}
{
feed_ids: [
{ content_id: '14', 'seen' : 1 },
{ content_id: '15', 'seen' : 0 },
{ content_id: '16', 'seen' : 0 },
{ content_id: '17', 'seen' : 0 }
]
}
{
follow_ids: [
{ content_id: '22' },
{ content_id: '23'},
{ content_id: '24'},
{ content_id: '25'}
]
}
所以,如果我有 70 000用户,那么我需要在 MongoDB
中创建 70 000集合我还有另一个选项来创建它:
一个集合的所有用户Feed ,每个用户在集合中都有一个文档,如:
{
user_id: '1',
feed_ids: [
{ content_id: '10'},
{ content_id: '11'},
{ content_id: '12'}
],
follow_ids: [
{ content_id: '9'},
{ content_id: '11'},
{ content_id: '14'}
]
}
并且这些表中的数据变得非常显着,我需要集合和文档才能执行所有操作,例如(插入,更新,选择,...)
我的feed_ids和follow_ids非常显着增长,我的疑问是:
select content_id from user_feed where user_id =1 limit 10 offset 20;
update user_feed set seen = 1 where user_id =1
select count(content_id) from user_feed where seen = 0;
select content_id from user_follow where user_feed_id =1 limit 10 offset 20;
insert into user_feed (user_id,content_id,seen) values (1,23,0);
第一个选项是我的用例或第二个选项的最佳解决方案吗?
感谢。
答案 0 :(得分:2)
由于nssize
限制(2GB),每个用户的一个集合永远不会扩展,因为这意味着每个数据库限制为300万用户(假设数据库只保留用户......)。一旦你开始在多个数据库上跨越这样的事情,那么你真的开始陷入实现问题。
这种设置没有性能优势,因为主要的好处是锁定和数据库级别。我仍然认为上面段落中的第一点即使是按照集合实现也会保留锁定。作为补充说明,由于MongoDB在更新未绑定的阵列时处理单个文档的方式会导致空间利用效率低下,因此会产生“瑞士奶酪”效应并导致大量碎片进一步降低性能。
所以基于此,不,我不会为每个用户制作一个集合。