了解分布

时间:2014-10-06 12:45:26

标签: mysql sql sas netezza

我有几个问题。

  1. 我想知道我们是否需要担心Netezza中的分发,而只使用select语句(而不是创建表)。 我基本上试图通过连接到Netezza并选择具有几个连接的视图来在SAS中创建数据集。我想知道如果我直接在SAS中创建表格,这将如何影响Netezza的性能。

  2. 我正在通过在customer_id上连接另外两个表来创建表。但是,输出数据集不包含customer_id作为列。我可以在customer_id上发布此表吗?

  3. 感谢。

1 个答案:

答案 0 :(得分:0)

对于您的第一个问题,如果您没有创建表格,通常不必担心分发问题。它有助于理解您选择的表的分发方法,但它肯定不是必需的。拥有支持您正在进行的特定连接的分发方法肯定有助于在选择期间的性能(例如,如果您的连接列是分发列的超集,那么您将获得共同定位的连接),但是如果目标是输出是SAS,然后对SAS的数据集的 write 没有影响。

对于第二个问题,表格分布在表格本身的列或列上,或者通过RANDOM(又名循环法)分发方法分发。在您的情况下,如果您将数据集存储在Netezza的表中,则无法在customer_id上分发数据,因为该列未包含在数据集中。