Question

我是Teradata的新手，我遇到的问题与我之前使用的数据库没有关系。基本上，我正在尝试减少where子句中子查询中返回的行数。使用ROWNUM函数我之前没有遇到任何问题。

我之前的查询类似于：

SELECT * FROM myTable
WHERE field1 = 'foo' AND field2 in(
    SELECT field2 FROM anotherTable
    WHERE field3 = 'bar' AND ROWNUM<100);

由于我不能在TD中使用ROWNUM，我已经找到了等效的功能或至少可以让我获得我想要的功能，即使它们并非完全相同。我找到并尝试了：ROW_NUMBER，TOP和SAMPLE。

我尝试了ROW_NUMBER（），但Teradata不允许在WHERE子句中使用分析函数。我尝试过TOP N但子查询中不支持此选项。我尝试了SAMPLE N，但子查询也不支持。

所以...我不得不承认我现在有点卡住了，并且想知道是否有任何解决方案可以让我限制使用Teradata在子查询中返回的行数，这将非常类似于我到现在为止做了什么？另外，如果没有，那么如何以不同的方式构建查询以便在Teradata中正确使用它？

谢谢！

Answer 1

子查询中SAMPLE或TOP的使用受限可能是因为这可能是相关子查询。

但有两种解决方法。

将SAMPLE或TOP放在子查询中的派生表中（这样就不再相关了）：

SELECT * FROM myTable
WHERE field1 = 'foo'
AND field2 IN (
     SELECT * FROM
       ( SELECT field2 FROM anotherTable -- or TOP 100
         WHERE field3 = 'bar'  SAMPLE 100
       ) AS dt
    );

或者将其重写为派生表的连接：

SELECT * FROM myTable
JOIN ( SELECT DISTNCT field2 FROM anotherTable -- can't use TOP if you need DISTINCT 
         WHERE field3 = 'bar' SAMPLE 100
       ) AS dt
WHERE field1 = 'foo'
AND myTable.field2 = dt.field1;

没有ORDER BY的TOP与ROWNUM非常相似。它根本不是随机的，但是第二次运行它可能仍会返回不同的结果集。

每次返回不同的结果时，SAMPLE都是随机的。

使用QUALIFY而不是WHERE也可以使用ROW_NUMBER，但是OLAP函数总是需要一些ORDER BY，因此开销要大得多。

使用Teradata限制子查询中的行数

1 个答案: