由Windows Azure SQL Database或AWS Big Data等云服务提供的数据库是否能够进行分布式计算,即查询优化器将工作划分为并行计算的服务器,类似于MapReduce的分发方式节点间的计算?
我在Azure documentation中找不到任何关于此类查询优化的内容,尽管PDW似乎可能会这样做。
答案 0 :(得分:1)
AWS拥有EMR(Elastic Map-Reduce),这是由AWS提供的Hadoop。
Azure拥有HDInsights,这是安装在Windows VM上的Hortonwork数据平台(Hadoop)。
据我所知,微软的PDW(并行数据仓库)不支持map-reduce,但他们正在研究它(http://www.zdnet.com/microsofts-polybase-mashes-up-sql-server-and-hadoop-7000007424/) - PDW本质上是一些带有中央管理层的SQL Server机器允许在不同节点之间划分和分配数据 - 如果数据驻留在多个节点上,它可以并且将破坏PDW节点之间的查询,但并行性本质上不是map-reduce。