准备与大数据相关的设计和架构问题的最佳方法

时间:2012-08-11 19:00:58

标签: algorithm data-structures bigdata

最近,我参加了一家公司的现场采访,我被问到与大数据相关的设计问题,例如:在时间t1和t2之间获取访问网站(比如google)的用户列表。使用什么数据结构,如何处理并发,陈旧数据,存储数据需要多少台服务器,以及每台服务器的要求(软件,硬件等)......

请指出一些书籍/网络参考资料,以增加我对这个新领域的了解。同时向我提供有关如何回答此类设计问题的见解

1 个答案:

答案 0 :(得分:3)

this book (free download)(亚马逊:mining of massive datasets)刚刚发布到HN(该帖子也有一些有用的评论) - 从第一次浏览看起来非常好。你可以读到它。