Teradata中顶级与样本的效率

时间:2017-04-30 17:41:57

标签: sql teradata

Teradata中效率更高 - 示例还是热门

由于样本是随机的,这是否会导致Teradata做更少的工作并导致更快的回报?

经常,我只想看几行。

线程相关: differences between top and sample in teradata sql

4 个答案:

答案 0 :(得分:3)

我刚在大型Teradata数据集上运行了三个查询:

  1. SELECT * FROM table Sample 10;
  2. SELECT * Top 10 FROM table;(没有订购)
  3. SELECT * Top 10 FROM table ORDER BY column;
  4. DBQL指标显示,到目前为止,没有订单的前10名资源最少。 I / O和I&O的下降幅度大约为99%。 CPU只是从SAMPLE更改为TOP。

    因此,如果您的目标纯粹是效率,那么没有Order by的TOP是TD的DBQL指标的明显赢家。

    DBQL Metrics

答案 1 :(得分:0)

TOP通常是更快的,当返回足够的数据时,将快捷方式排除在处理之外。

Sample有很多选项,并且在统计上是正确的。要实现这一点,可能需要读取更多数据块。

答案 2 :(得分:0)

从效率的角度来看:

使用Top 没有 Order BySample大致相同。

使用Top WITH Order By将导致更多开销。

答案 3 :(得分:-2)

我认为最好使用TOP而不是sample。这两个都在显示结果之前评估整个表达式。

参考:http://www.teradatatips.com/2010/10/top-vs-sample.html