我想知道所有数据库/数据库堆栈溢出在底层使用的是什么,管理各种垂直行业的大量用户配置文件信息。
正如我在twitter和facebook这样的社交网站上的情况,大数据管理网络是通过hadoop完成的。堆栈溢出是否也处理如此大量的数据?
如何对信息建立索引,是否是stackoverflow解决方案的一部分?
理解在世界上最受欢迎的技术论坛上部署的解决方案将非常有趣。
答案 0 :(得分:1)
本文简要介绍了stackoverflow的架构在2011年3月左右的情况:http://highscalability.com/blog/2011/3/3/stack-overflow-architecture-update-now-at-95-million-page-vi.html
从高层次来看,它是一个.NET应用程序,它使用MS SQL服务器作为数据库,Redis用于缓存,HAProxy用于负载平衡,以及一系列工具并托管在Windows服务器和Linux服务器上(ubuntu + centos) )。
看起来他们在该文章时没有使用任何hadoop,但这可能已经改变了。他们也可能正在为map / reduce类型的作业做一些不同的/自定义的事情,或者根本不需要这样的事情。凭借精致,SQL服务器可以扩展到相当远,而无需依靠“大数据”玩具。如果您可以从缓存层中获取大部分数据,则尤其如此。