我不确定在哪里提出这个问题,所以我会在这里问一下,因为我认为这可能会成为未来可能有类似问题的用户的一个很好的参考。
Apache HAWQ(http://hawq.incubator.apache.org/)是否有任何已知的生产用法?我想将此服务与Presto,Spark,Impala等其他服务进行比较。但除了漂亮的基准测试之外,我还没有遇到任何现实世界的用法。最后,如果您亲自使用过这个,那么您的体验是什么?
答案 0 :(得分:1)
目前还没有针对apache hawq的独立文档。但社区正在将文档从关键的hdb转移到apache hawq。页面上的文档链接链接到hdb文档(http://hdb.docs.pivotal.io/211/hdb/index.html)。你可以先参考这个,你可以在https://github.com/apache/incubator-hawq-docs找到incubator-hawq-docs项目。
此外,如果您不知道在哪里提问,您可以订阅开发者和用户邮件列表,发送电子邮件至dev-subscribe@hawq.incubator.apache.org / user-subscribe@hawq.incubator.apache。 org订阅并发送电子邮件至dev@hawq.incubator.apache.org/user@hawq.incubator.apache.org提问。
答案 1 :(得分:0)
Pivotal HDB(HAWQ的商业产品)在不同的客户。 Hawq是基于MPP历史的真正100%SQL兼容的SQL引擎。这是一个独特的产品,具有最先进的查询优化器和动态分区消除功能,具有Hbase,Hive,JSON,ORC(beta)和本机hadoop文件系统的非常强大的HDFS数据联合功能。 Hawq使用镶木地板存储格式,因此在hawq中创建的表可用于Hadoop生态系统.Hawq能够收集外部表的统计数据,以便更快地访问数据。支持ACID事务(插入)。除此之外,最引人注目的功能是在sql中使用语言扩展进行数据科学,支持R,Python,Java,Perl。我见过HAWQ在汽车,石油和天然气,物联网,医疗保健行业的实施。我经历的典型用例是在hadoop,数据科学模型培训和执行模型,结构化数据上的Interactive SQL之上的BI。由于HAWQ诞生于Greenplum遗产,因此hawq的一些功能在竞争产品中很难找到。 Hawq完美地补充了Hadoop生态系统。