我有一张包含大量数据的表(比如1,000,000,000行)。
表格结构:
Id(Primary Key)
Name
...
我已经省略了表中的其他字段,因为我不能使用其中的任何字段来限制我获取的数据。
这里的主键是Id
。我没有任何索引,只有名称列。
我需要找到一个超过n次的名字列表(说n = 10)。
我尝试过以下选项:
SELECT /+full(T)/ Name,COUNT(Id) AS CNT FROM T GROUP BY Name HAVING COUNT(ID) >10;
select distinct Name, COUNT(ID) OVER (PARTITION BY Name) AS CNT FROM T where CNT>10;
它们都占用了很大的温度空间。
优化查询以使用更少临时空间的任何其他建议。 速度不是我的主要关注点。即使查询大约需要2个小时,也没关系。
答案 0 :(得分:0)
WITH names AS( 选择名称,COUNT(ID)OVER(按名称分区)AS CNT FROM T) 从名称中选择DISTINCT名称,其中names.CNT> 10