比较Google BigQuery与Amazon Redshift表明两者都可以回答相同的要求,主要因成本计划而异。看起来Redshift配置(定义键和优化工作)与Google BigQuery相比可能会遇到加入表的问题。
有专业人士吗? Google BigQuery与Amazon Redshift的利弊列表?
答案 0 :(得分:33)
我在reddit上发布了这个比较。很快,一位长期的RedShift从业者开始评论我的陈述。有关完整的对话,请参阅https://www.reddit.com/r/bigdata/comments/3jnam1/whats_your_preference_for_running_jobs_in_the_aws/cur518e。
调整群集大小:
无所事事时的每小时成本:
查询速度:
索引:
吸尘:
数据分区和分发:
直播实时数据:
发展群集:
多区域:
要尝试BigQuery,您不需要信用卡或任何设置时间。试试吧(quick instructions to try BigQuery)。
当您准备将自己的数据放入BigQuery时,只需将您的JSON换行符号日志复制到Google Cloud Storage并导入它们。
请参阅云端数据仓库定价的深度指南: Understanding Cloud Pricing Part 3.2 - More Data Warehouses
答案 1 :(得分:11)
Amazon Redshift是一个标准的SQL数据库(基于Postgres),具有MPP功能,可以扩展。这些功能还要求您在某种程度上符合您的数据模型,以获得最佳性能。它支持大量的SQL标准,大多数可以与Postgres通信的工具可以不加改变地使用它。
BigQuery不是数据库in the sense that there it doesn't use standard SQL and doesn't provide JDBC/ODBC connectivity。它拥有自己的API和接口,是一项独特的服务。它为SQL查询提供有限的支持,但大多数用户通过自定义代码(Java,Python等)进行交互。一些第三方工具增加了对BigQuery的支持,但现有工具无法在没有修改的情况下工作。
tl; dr - Redshift更适合与现有工具交互并使用复杂的SQL。 BigQuery更适合自定义编码交互和不喜欢SQL的团队。
更新2017-04-17 - 这是一个更新的成本和速度差异摘要(包含在销售推销中,因此YMMV)。 TL; DR - Redshift通常更快,如果您经常查询数据会更便宜。 http://blog.panoply.io/a-full-comparison-of-redshift-and-bigquery
更新 - 由于我不断对此(♂️)投票,这是对另一个答案中项目的最新回复:
调整群集大小:
无所事事时的每小时成本:
查询速度:
索引:
吸尘:
数据分区和分发:
直播实时数据:
发展群集:
多区域: