Spark-SQL中的DISTRIBUTE BY和CLUSTER BY

时间:2019-07-14 05:02:45

标签: sql apache-spark-sql

我刚刚介绍了Spark-SQL。尽管我以前在RDBMS sql(Oracle,Teradata,Sql Server等)方面有丰富的经验,但我希望在Spark-SQL中扩展我的知识,为什么要在Spark-SQL中学习高级功能/概念。

因此,在此过程中,我遇到了DISTRIBUTE BY和CLUSTER BY子句。但是,我无法弄清楚这些子句在Spark SQL中是否起作用,如果起作用,它们如何起作用。

因此,有人能指出我正确的方向吗?如果有人用一些示例解释了这两个子句(前提是它们可以在Spark-Sql中使用)并向我指出学习Spark-Sql高级功能的资源,那就太好了。

谢谢。

0 个答案:

没有答案