计算表中String的出现次数,并在新列中报告

时间:2017-11-11 02:37:14

标签: sql tsql count rdbms

输入

Name
A
A
B
B
B
B
C
B
C
A
D

必需的输出

Name    Occurance
A   1
A   2
B   1
B   2
B   3
B   4
C   1
B   5
C   2
A   3
D   1

请注意 - 我在名称列中有超过100000个唯一条目,因此我无法在代码中硬编码名称

2 个答案:

答案 0 :(得分:1)

SQL表代表无序集。订购仅由指定排序的列提供。

假设您有一个排序 - 例如标识id列 - 您可以使用行号方法的差异:

select name, count(*)
from (select name,
             row_number() over (order by id) as seqnum,
             row_number() over (partition by name order by id) as seqnum_n
      from t
     ) t
group by name, (seqnum - seqnum_n);

要理解为什么这样有效,你必须盯着子查询的结果,直到你得到"得到"为什么差异定义了相邻的值。

答案 1 :(得分:1)

预期结果显示(例如)A出现3次并且编号为1,2,3,即使它们并非全部一起出现。单个row_number()就足够了:SQL Fiddle

CREATE TABLE Table1 (ID int identity(1,1) primary key, [Name] varchar(1));   
INSERT INTO Table1 ([Name])
VALUES     ('A'),('A'),('B'),('B'),('B'),('B'),('C'),('B'),('C'),('A'),('D');

查询1

select
       name
     , row_number() over (partition by name order by id) as Occurance
from table1
order by id

由于表被认为是无序集,为了重现预期结果中显示的序列,必须有一些其他列。我为此假设了一个标识列ID。

<强> Results

| name | Occurance |
|------|-----------|
|    A |         1 |
|    A |         2 |
|    B |         1 |
|    B |         2 |
|    B |         3 |
|    B |         4 |
|    C |         1 |
|    B |         5 |
|    C |         2 |
|    A |         3 |
|    D |         1 |

如果你不熟悉这些,我建议你这样做非常方便:

  1. ROW_NUMBER()
  2. SELECT - OVER()