SQL查询以查找购物车中的所有组合及其出现

时间:2019-04-12 13:57:17

标签: sql sql-server

我有一个包含两列的表,即[USER]和[ITEM]。每个项目都不会出现多次。

该表的示例可能是:

[USER]  [ITEM]
A        001
A        002
B        002
B        001
B        003
C        001

我想提取使用SQL购买过的所有商品序列。在这种情况下:

[SEQUENCE]    [OCCURRENCES]    [LENGTH SEQUENCE]
001            3                 1
002            2                 1
003            1                 1
001-002        2                 2
001-002-003    1                 3

我相信将数据排序到表中的最佳方法是:

[SEQUENCE]    [ITEM]    [OCCURENCES]   [LENGTH SEQUENCE]
1             001        3              1
2             002        2              1
3             003        1              1
4             001        2              2
4             002        2              2
5             001        1              3
5             002        1              3
5             003        1              3

我发现这篇文章“ SQL Query For Most Popular Combination”,但仅提取了2个元素的组合。

您对如何获得这种输出有任何想法吗? 谢谢!

1 个答案:

答案 0 :(得分:2)

要进行这种频率分析,您需要一种方法来创建每次交易中购买的产品的所有组合。为此,递归SQL是必经之路。

从购买表开始:

create table purchases (id varchar(6), product varchar(6));
insert into purchases 
values ('A','001')
      ,('A','002')
      ,('B','002')
      ,('B','001')
      ,('B','003')
      ,('C','001');

我们使用以下递归查询来生成每个交易的所有购买组合,每个组合最多限制5个项目(如果需要,您可以更改该限制),然后按照递归公共条件对查询中生成的组合执行频率分析表表达式:

with recur(id, length, combo, lastitem) as (
  -- Anchor Query
  select p.id, 1, cast(product as varchar(max)), product from purchases p

  union all -- Recursive Part
  select r.id, length+1, combo+','+product, product
    from recur r
    join purchases p
      on p.id = r.id
     and p.product > r.lastitem
   where r.length < 5
)
-- Output query
select length, combo, count(*) frequency
  from recur
 group by length, combo
 order by frequency desc
     , length desc
     , combo;

根据给定数据得出以下结果:

length | combo       | frequency
-----: | :---------- | --------:
     1 | 001         |         3
     2 | 001,002     |         2
     1 | 002         |         2
     3 | 001,002,003 |         1
     2 | 001,003     |         1
     2 | 002,003     |         1
     1 | 003         |         1