我特别感兴趣的是如何处理Google搜索或Google地图等商业服务的大量信息。我们都知道他们使用(或至少“做过”)一种Linux集群,但它们究竟是如何组织的?他们使用什么样的硬件,什么文件系统,网络,哪些问题最常见?
答案 0 :(得分:1)
答案取决于你想要做什么。谷歌创建了自己的分发数据库,但他们也创建了自己的计算农场和许多其他东西。一旦你决定采用相同的方式,没有简单的aswer做什么,但肯定你需要数百万投资到基础设施和开发。马修在评论链接中提到谷歌所做的事情。
但是,如果您的目标是创建Web应用程序,那么您可能不希望自己花时间创建infrasturucture,而是使用市场上已有的内容。如果您想创建可以处理大量数据的应用程序,每小时为数百万客户提供服务,那么您应该定期查看Amazon Elastic Computing Cloud和Microsoft Azure等云基础架构。
优点是,您可以以合理的价格获得具有已实施的数据库应用程序和即时可扩展性的巨大计算服务器场,并且无需与之相关的IT成本。当需求峰值通过时,您可以立即将其从一个服务器扩展到一百个,然后再缩回一个服务器。
以下是亚马逊弹性计算云的说明: http://aws.amazon.com/ec2/
以下是对可扩展数据库服务的描述: http://aws.amazon.com/simpledb/ http://aws.amazon.com/rds/