将逗号分隔的列数据拆分为其他列

时间:2011-12-21 04:06:43

标签: postgresql split delimiter postgresql-8.4

我在一列中用逗号分隔数据:

Column 
------- 
a,b,c,d 

我想将逗号分隔数据拆分为多个列以获得此输出:

Column1  Column2 Column3 Column4 
-------  ------- ------- -------
a        b       c       d 

如何实现这一目标?

3 个答案:

答案 0 :(得分:86)

split_part()只需一步即可完成您的工作:

SELECT split_part(col, ',', 1) AS col1
     , split_part(col, ',', 2) AS col2
     , split_part(col, ',', 3) AS col3
     , split_part(col, ',', 4) AS col4
FROM   tbl;

添加与col中的项目一样多的行(可能的最大值)。超出数据项的列将为空字符串('')。

答案 1 :(得分:56)

如果CSV中的字段数不变,那么您可以执行以下操作:

select a[1], a[2], a[3], a[4]
from (
    select regexp_split_to_array('a,b,c,d', ',')
) as dt(a)

例如:

=> select a[1], a[2], a[3], a[4] from (select regexp_split_to_array('a,b,c,d', ',')) as dt(a);
 a | a | a | a 
---+---+---+---
 a | b | c | d
(1 row)

如果CSV中的字段数不是常数,那么您可以使用以下内容获得最大字段数:

select max(array_length(regexp_split_to_array(csv, ','), 1))
from your_table

然后为您的查询构建相应的a[1], a[2], ..., a[M]列列表。因此,如果上面给出的最大值为6,那​​么你可以使用它:

select a[1], a[2], a[3], a[4], a[5], a[6]
from (
    select regexp_split_to_array(csv, ',')
    from your_table
) as dt(a)

如果需要,您可以将这两个查询合并到一个函数中。

例如,提供此数据(在最后一行中为NULL):

=> select * from csvs;
     csv     
-------------
 1,2,3
 1,2,3,4
 1,2,3,4,5,6

(4 rows)

=> select max(array_length(regexp_split_to_array(csv, ','), 1)) from csvs;
 max 
-----
   6
(1 row)

=> select a[1], a[2], a[3], a[4], a[5], a[6] from (select regexp_split_to_array(csv, ',') from csvs) as dt(a);
 a | a | a | a | a | a 
---+---+---+---+---+---
 1 | 2 | 3 |   |   | 
 1 | 2 | 3 | 4 |   | 
 1 | 2 | 3 | 4 | 5 | 6
   |   |   |   |   | 
(4 rows)

由于您的分隔符是一个简单的固定字符串,您还可以使用string_to_array代替regexp_split_to_array

select ...
from (
    select string_to_array(csv, ',')
    from csvs
) as dt(a);

感谢Michael有关此功能的提醒。

您真的应该重新设计数据库架构,以便尽可能避免使用CSV列。您应该使用数组列或单独的表。

答案 2 :(得分:1)

您可以使用分割功能。

    SELECT 
    (select top 1 item from dbo.Split(FullName,',') where id=1 ) Column1,
    (select top 1 item from dbo.Split(FullName,',') where id=2 ) Column2,
    (select top 1 item from dbo.Split(FullName,',') where id=3 ) Column3,
    (select top 1 item from dbo.Split(FullName,',') where id=4 ) Column4,
    FROM MyTbl