考虑一个网站每天获得大约50K的独立访问者。现在,我想跟踪使用像素跟踪访问网站的用户。在开始任何开发之前,我希望决定我将用于该项目的存储数据库。
显然,这将是一个写密集型数据库,当有人(管理员)试图查看分析数据时,写入次数太多,搜索次数很少。
那么,我应该为这个项目使用什么类型的数据库 - mysql或者没有sql?
如果我不清楚我是否怀疑,请发表评论。
谢谢!
答案 0 :(得分:0)
考虑到提供的负载估计和合理的保留策略,比如2年的数据,我相信常规的关系数据库应该这样做。 MySQL支持分区表和分区存档。
用户访问数据可以按日期自然分区。对这类数据的分析查询通常还涉及日期或日期范围。为避免管理太多太小分区的性能问题,我建议按周划分范围。
如果您的数据增长了2个数量级(每天10M记录而不是100K),您应该认真考虑一些大数据解决方案。 Flume / Hadoop / Hive的组合允许以最小的修改重用您的分析查询。
答案 1 :(得分:0)