使用逗号分隔值从特定列获取所有不同的值

时间:2018-03-09 15:22:52

标签: sql oracle oracle11g

我正在创建一个SQL查询。我尝试了stackoverflow中的多个链接并用谷歌搜索它,但不喜欢解决方案。我有以下内容:

column_name
1,2,3,string1
3,1,string2
4,5,string3
2,4,string1

所以我想要以下输出:

1,2,3,4,5,string1,string2,string3,string4

基本上我想从逗号分隔列中获取所有唯一值。我知道distinct与列中的每一行相比给出了不同的值,但是在上述情况下我们怎么做呢。

注意:我使用的是Oracle 11g数据库。 Kaushik的答案在SQL Fiddler中看起来不错。但它没有工作,因为我有超过20k行。有没有其他选择 ?

3 个答案:

答案 0 :(得分:2)

使用传统方法将单个字符串拆分为不同的行,然后连接。唯一的问题是连接的字符串不应超过4000个字符

SQL Fiddle

Oracle 11g R2架构设置

CREATE TABLE yourtable
    (column_name varchar2(13))
;

INSERT ALL 
    INTO yourtable (column_name)
         VALUES ('1,2,3,string1')
    INTO yourtable (column_name)
         VALUES ('3,1,string2')
    INTO yourtable (column_name)
         VALUES ('4,5,string3')
    INTO yourtable (column_name)
         VALUES ('2,4,string1')
SELECT * FROM dual
;

查询1

select LISTAGG(val,',') WITHIN GROUP ( ORDER BY val ) as final
FROM
(
select distinct  trim(regexp_substr(column_name,'[^,]+', 1, level) ) as val 
  from yourtable
   connect by regexp_substr(column_name, '[^,]+', 1, level) is not null
  ORDER BY val
 )

<强> Results

|                             FINAL |
|-----------------------------------|
| 1,2,3,4,5,string1,string2,string3 |

答案 1 :(得分:0)

您可以使用regexp_replace删除重复项并使用listagg

连接结果
SELECT 
       RTRIM(
         REGEXP_REPLACE(
           (listagg(Num,',') WITHIN GROUP (ORDER BY Num) OVER ()), 
           '([^,]*)(,\1)+($|,)', 
           '\1'),
         ',') Nums 
FROM Table;

答案 2 :(得分:-1)

this question

中回答
create table ##Testdata(SomeID int, OtherId varchar(100), Data varchar(max))
insert ##Testdata select 1, '1,2,3', '1,2,3'
insert ##Testdata select 2, '3,1', '3,1'
insert ##Testdata select 3, '4,5', '4,5'
insert ##Testdata select 4, '2,4', '2,4'

;with tmp(SomeID, OtherID, DataItem, Data) as (
select SomeID, OtherID, LEFT(Data, CHARINDEX(',',Data+',')-1),
    STUFF(Data, 1, CHARINDEX(',',Data+','), '')
from ##Testdata
union all
select SomeID, OtherID, LEFT(Data, CHARINDEX(',',Data+',')-1),
    STUFF(Data, 1, CHARINDEX(',',Data+','), '')
from tmp
where Data > ''
)
select SomeID, OtherID, DataItem
from tmp
order by SomeID
-- OPTION (maxrecursion 0)
-- normally recursion is limited to 100. If you know you have very long
-- strings, uncomment the option