如何从聚合文本字段中解析和删除重复项

时间:2016-07-20 12:37:55

标签: sql postgresql

我的列有

之类的值
select chipset_name from chipset

    chipset_name
    "Chip A,Chip B"
    "Chip A"
    "Chip F"
    "DSOG K"
    "FROW 01 33"
    "Chip F,DSOG K"
    ...

我想将它聚合到一行而不重复,但如果我使用string_agg(distinct ..)我有重复

select string_agg(distinct chipset_labels,',')from chipset
----------
Chip A,Chip B,**Chip A**,Chip F,DSOG K,FROW 01 33,Chip F,**DSOG K**

如何解析和删除重复项?

由于

2 个答案:

答案 0 :(得分:2)

函数string_to_array(chipset_name, ',')会将名称转换为数组。然后unnest他们,只选择不同的值。

select distinct token
from 
    chipset, 
    unnest(string_to_array(chipset_name, ',')) token

   token    
------------
 Chip A
 Chip B
 Chip F
 DSOG K
 FROW 01 33
(5 rows)        

答案 1 :(得分:1)

regexp_split_to_table不需要取消:

select string_agg(distinct cl, ',')
from 
    chipset, 
    regexp_split_to_table(chipset_labels, ',') cl(cl)
;
               string_agg               
----------------------------------------
 Chip A,Chip B,Chip F,DSOG K,FROW 01 33